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译 者 序 


数据 库 管理 在 信息 化 建设 中 具有 非常 重要 的 地 位 ， 是 计算 机 相关 专业 的 必修 课程 。 计 算 机 
专业 人 员 应 该 扎实 地 掌握 数据 库 管理 的 概念 、 技 术 和 方法 。 本 书 作为 本 科 生 和 研究 生 的 教材 ， 
在 国际 上 已 经 成 功 地 使 用 了 15 年 。 本 书 内 容 人 全面， 由浅 入 深 ， 每 一 章 后 面 都 配 有 丰富 的 练习 ， 
并 且 有 一 个 贯穿 全 书 的 项 目 案例 。 利 用 每 一 章 后 面 的 练习 和 这 个 完整 的 项 目 案 例 ， 读 者 可 以 逐 
步 掌 握 信息 系统 开发 的 理论 知识 和 实践 技能 。 

近 十 几 年 来 ， 计 算 机 技术 和 信息 系统 领域 的 技术 迅猛 发 展 。 本 书 已 经 是 第 6 版 ， 在 这 一 版 
中 ， 作 者 尽力 体现 了 信息 系统 的 相关 技术 和 方法 所 发 生 的 变化 ， 如 支持 Web 的 信息 系统 设计 和 
程序 设计 、 大 规模 数据 库 和 数据 仓库 、 通 过 深入 的 系统 建 模 和 设计 来 说 明 系 统 需 求 (如 实体 - 
联系 模型 ， 扩 展 的 实体 -联系 模型 和 面向 对 象 的 数据 建 模 ) 以 及 与 日 俱 增 的 联机 环境 中 数据 库 
性 能 的 关键 性 等 。 

本 书 的 翻译 是 在 复旦 大 学 施 伯乐 教授 的 统一 组 织 和 管理 下 完成 的 ， 多 位 教师 参与 了 本 书 的 
翻译 工作 。 陈 金海 教授 (第 1 章 、 第 2 章 )、 李 晓 荣 博士 (第 3 章 )、 杨 卫 东 副教授 (第 4 章 )、 谈 
子 敬 博士 (第 5 章 、 第 6 章 )、 孙 未 未 副教授 (第 7 章 、 第 8 章 、 第 9 章 )、 刘 卉 博士 〈 第 10 章 、 第 
11 章 )、 方 锦 成 副教授 〈 第 12 章 、 第 13 章 )、 丁 保 康 副教授 〈 第 14 章 、 第 15 章 、 附 了 录 C 和 附录 D) 
承担 了 主要 的 翻译 工作 。 此 外 ， 杨 卫 东 副教授 统 稿 并 翻译 了 本 书 的 前 言 、 缩 略语 表 、 附 录 A 和 
附录 8B ， 孙 未 未 副教授 和 李 晓 荣 博士 参与 了 部 分 章节 的 整理 、 补 译 、 校 对 和 修改 工作 。 

特别 感谢 机 械 工业 出 版 社 的 编辑 杨 海 玲 、 朱 劫 及 其 同事 ， 他 们 付出 的 辛勤 劳动 和 提出 的 
许多 意见 ， 尤 其 是 朱 动 编辑 细致 、 严 谨 的 工作 ， 这 些 都 是 本 书 顺 利 出 版 的 保证 。 

由 于 译 者 水 平 有 限 ， 时 间 紧 迫 ， 难 免 有 翻译 不 当 之 处 ,希望 读者 批评 指正 。 





前 言 

本 书 可 作为 数据 库 管 理 的 入门 教材 。 这 门 课程 是 信息 系统 课程 的 一 部 分 ， 可 在 商学 院 、 计 
算 机 技术 专业 和 应 用 计算 机 科学 系 讲授 。 信息 技术 专业 学 会 (AITP)、 美 国 计 算 机 学 会 (ACM ) 
以 及 国际 信息 处 理 联合 会 (IFIPS ) 的 指导 方针 (例如 IS'97) 都 概述 了 这 种 类 型 的 数据 库 管 理 
课程 。 本 书 以 前 的 版 本 在 研究 生 和 本 科 生 的 教学 以 及 管理 和 专业 开发 项 目 中 ， 已 成 功 地 使 用 了 
15 年 之 入 。 

本 书 在 第 5 版 的 基础 上 进行 了 修订 。 在 数据 库 管 理 领 域 ， 相 关 技 术 、 管 理 、 方 法 正 以 前 所 
未 有 的 速度 发 生 着 变化 ， 为 了 适应 这 种 变化 ， 本 书 作出 了 必要 的 修订 。 但 是 ， 我 们 也 尽量 保持 
前 面 版 本 的 优点 。 我 们 尽 所 有 努力 来 体现 在 第 4 版 中 介绍 的 现代 数据 库 管理 的 特点 。 

在 第 6 版 中 ， 由 于 Fred McFadden 已 退休 ， 减 少 了 相应 的 工作 ， 所 以 我 们 改变 了 作者 的 署名 
顺序 。Fred 对 手稿 进行 了 仔细 的 审 校 ， 并 在 修订 方向 上 提出 了 中 肯 的 建议 。Fred McFadden 是 
本 书 之 父 ， 本 书 自始至终 都 体现 着 他 的 思想 。 


第 6 版 的 新 增 内 容 


由 于 管理 实践 、 数 据 库 设 计 工具 、 方 法 学 和 数据 库 技术 飞速 发 展 ， 因 此 本 书 对 这 些 领域 的 
内 容 进 行 了 更 新 和 扩充 。 本 书 反映 了 信息 系统 领域 的 主要 发 展 趋势 和 现代 信息 系统 专业 的 学 生 
需要 掌握 的 技巧 。 

“在 总 的 客户 /服务 器 体系 结构 内 ， 设 计 支 持 Web 的 系统 并 进行 程序 设计 。 

* 大 规模 数据 库 和 数据 仓库 。 

* 通过 完全 的 系统 建 模 和 设计 明确 系统 需求 。 

“ 在 日 益 增加 的 联机 环境 中 ， 数 据 库 性 能 的 重要 性 。 

“SQL 作为 数据 库 查 询 的 标准 。 

在 所 有 章 中， 新 的 屏幕 图 反映 了 最 新 的 数据 库 技术 ， 新 添加 的 “Web 资 源 ”小 节 列 出 了 一 
些 网 站 ， 这 些 网 站 补充 本 书 涵盖 的 重要 主题 ， 为 学 生 提供 最 新 的 数据 库 发 展 趋势 及 其 背景 。 本 
书 在 结构 上 的 主要 变化 包括 : . 

* 介绍 面向 对 象 数 据 库 的 两 章 放 在 一 起 ， 并 且 放 在 本 书 的 结尾 。 这 样 ， 这 些 新 出 现 的 数据 

库 技术 可 以 完整 地 呈现 给 读者 ， 同 时 不 影响 其 他 章 的 连贯 性 。 

" 本 书 对 客户 /服务 器 部 分 的 改动 很 大 ， 现 在 强调 了 因特网 、 内 部 网 、 外 部 网 作为 客户 /服务 

器 体系 结构 的 实现 。 

“SQL 的 讨论 更 加 深入 并 用 两 章 加 以 介绍 。 

“ 重 写 了 数据 仓库 这 一 章 的 大 部 分 内 容 ， 并 前 移 到 本 书 的 实现 部 分 ,体现 了 这 种 数据 库 的 

爆炸 性 增长 。 

下 面 逐 章 给 出 本 书 的 主要 变化 。 每 一 章 的 描述 说 明了 该 章 的 目的 ， 以 及 相对 于 第 5 版 所 作 
的 变化 和 修订 。 

第 一 部 分 ”数据库 管理 语 境 
“第 1 章 “该 章 讨论 了 数据 库 在 组 织 中 的 作用 ， 并 概述 了 本 书后 面 各 章 的 主要 主题 。 该 章 介 
绍 了 修正 的 数据 库 的 分 类 模式 ， 在 第 5 版 中 分 为 四 类 ， 即 个 人 、 工 作 组 、 部 门 和 企业 ， 现 
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在 引入 了 因特网 、 内 部 网 、 外 部 网 数据 库 。 对 企业 数据 库 的 介绍 进行 了 扩展 ， 包 括 作 为 
ERP 系 统 和 数据 仓库 的 一 部 分 的 数据 库 。 该 章 更 新 了 数据 库 技 术 从 数据 库 前 的 文件 到 对 
象 -关系 数据 库 以 及 支持 Web 系 统 的 历史 的 讨论 。 该 章 继续 给 出 数据 库 技 术 和 传统 文件 处 
理 系统 的 比较 。 

。 第 2 章 ”该 章 在 更 为 宽泛 的 信息 系统 开发 的 语 境 下， 详细 讨论 了 数据 库 开发 的 作用 ， 解 释 
了 数据 库 开发 的 结构 化 生命 周期 法 和 原型 法 。 该 章 还 讨论 数据 库 开发 的 重要 问题 ， 包 括 
数据 库 开 发 中 的 各 种 人 员 的 管理 和 理解 数据 库 结构 及 技术 的 框架 。 该 章 还 强调 了 数据 库 
开发 中 的 信息 工程 方法 学 ， 包 括 企业 数据 模型 的 作用 。 该 章 内 容 与 学 生 在 系统 分 析 和 设 
计 课 程 中 所 学 内 容 是 一 致 的 。 

第 二 部 分 “数据库 分 析 

“第 3 章 ”该 章 给 出 了 一 个 新 标题 ,深入 介绍 如 何 用 实体 ~ 联系 模型 进行 概念 数据 建 模 。 新 
的 章 名 反映 了 该 章 强调 实体 -联系 模型 的 动机 ， 即 准确 描述 影响 数据 库 设 计 的 业务 规则 。 
该 章 包 括 一 个 全 新 的 小 节 ， 介 绍 业务 规则 建 模 的 最 新 方法 ， 该 节 中 的 内 容 详 细 解 释 了 开 
发 含义 明确 的 实体 -联系 图 的 本 质 部 分 一 一 如 何 命名 和 定义 数据 模型 元 素 。 有 一 个 新 的 
小 节 解 决 了 很 多 学 生 在 学 习 数 据 建 模 时 所 面临 的 一 个 问题 : 是 将 数据 表示 为 属性 还 是 表 
示 为 联系 。 该 章 继续 从 简单 的 例子 过 渡 到 复杂 的 例子 ， 并 以 一 个 易于 理解 的 松 谷 家 具 公 
司 的 E-R 图 结束 。 

“第 4 章 该 章 讲述 几 种 高 级 的 实体 -联系 模型 的 结构 。 该 章 的 新 内 容 是 对 实体 罕 簇 的 介绍 ， 
实体 奉 徐 是 表示 实体 -联系 图 的 简单 版 本 的 一 种 方法 。 该 章 基 于 最 新 的 指导 原则 ， 更 新 
了 GUIDE 业 务 规则 方法 的 内 容 ， 给 出 了 这 些 指导 原则 的 结构 ， 这 些 指导 原则 有 利于 学 生 
的 理解 。 本 章 继续 深入 讨论 超 类 型 / 子 类 型 联系 。 

第 三 部 分 ”数据 库 设 计 

“第 5 章 。 该 章 论述 将 概念 数据 模型 转化 为 关系 数据 模型 的 过 程 。 该 章 对 外 键 特征 进行 了 更 
详细 的 讨论 ， 并 介绍 了 非 智能 企业 键 的 重要 概念 。 该 章 也 强调 了 企业 键 (也 称 为 数据 仓 
库 的 代理 键 ) 的 概念 ， 因 为 面向 对 象 的 一 些 概念 被 移植 到 关系 数据 库 中 。 该 章 继续 强调 
关系 数据 模型 的 基本 概念 和 数据 库 设 计 人 员 在 逻辑 设计 过 程 中 的 角色 。 

“第 6 章 ”该 章 论述 获得 有 效 数据 库 设 计 的 关键 步骤 。 该 章 强调 改善 数据 库 性 能 的 方法 。 参 
芳 Oracle 和 其 他 DBMS 使 用 的 改善 数据 库 处 理性 能 的 特定 技术 ， 对 这 几 节 进行 了 扩充 。 该 
章 扩展 了 对 索引 的 讨论 ， 使 其 包括 索引 类 型 的 描述 ( 主 索引 、 辅 索引、 联结 索引 和 和 散 列 
索引 表 ) 以 更 广泛 地 适用 于 数据 库 技术 ,并 改善 查询 速度 。 该 章 对 RAID 的 讨论 作 了 更 新 ， 
以 反映 该 重要 技术 的 最 新 思想 。 该 章 继续 强调 物理 设计 过 程 及 过 程 的 目标 。 

第 四 部 分 ”实现 

“第 7 章 ”该 章 全 面 介绍 了 目前 大 部 分 DBMS 使 用 的 SQL (SQL-92)， 并 介绍 了 最 新 的 SQL- 
99 标 准 中 的 变化 。 第 6 版 的 主要 变化 是 扩展 了 整个 SQL 的 内 容 并 在 该 章 和 下 一 章 中 介绍 。 
该 章 包括 了 更 多 的 SQL 代码 例子 ， 大 部 分 代码 使 用 了 SQL-99 中 的 语法 ， 一 些 代码 使 用 了 
Oracle 8; 的 语法。 本 书 对 视图 的 描述 进行 了 修改 ， 包 括 动态 视图 和 物化 视图 。 第 7 章 解 释 
了 创建 和 维护 数据 库 的 SQL 命令 以 及 编写 单 表 查询 的 方法 。 该 章 继续 使 用 松 谷 家 具 公 司 
案例 说 明 各 种 实际 查询 和 查询 结果 。 

" 第 8 章 ”这 是 新 的 一 章 ， 通 过 多 表 查 询 、 事 务 完 整 性 、 数 据 字 典 、 触 发 器 、 存 储 过 程 、 在 
其 他 编程 语言 程序 中 的 嵌 人 式 SQL 继续 解释 SQL。 该 章 包 括 各 种 形式 的 OUTER JOIN 命 
令 ， 说 明 如 何在 导出 表 中 存储 查询 结果 ， 如 何 用 CAST 命 令 在 不 同 数据 类 型 之 间 转 换 数 据 
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以 及 在 SQL 中 作 条 件 处 理 的 CASE 命 令 。 沪 章 也 讨论 SQL-99 作 为 数据 仓库 的 数据 访问 工 
具 所 需 的 联机 分 析 处 理 (OLAP) 特性 。 和 第 7 章 一 样 ，SQL 代 码 的 例子 大 部 分 使 用 SQL- 
99 中 的 语法 ， 一 些 使 用 Oracle 8i 的 语法 。 该 章 继续 清晰 地 解释 SQL 中 最 为 复杂 和 功能 强 
大 的 概念 : 子 查询 和 相关 子 查 询 。 

。 第 9 章 ”该 章 结合 第 5 版 的 两 章 重 写 了 大 部 分 内 容 ， 晶 的 是 对 客户 /服务 器 的 体系 结构 、 应 
用 程序 、 中 间 件 和 在 当今 数据 库 环境 中 对 客户 机 数据 库 的 访问 进行 深入 讨论 。 该 章 为 本 
书后 面 的 关于 因特网 的 部 分 提供 了 技术 基础 。 该 章 对 许多 图 进行 了 更 新 ， 以 便 更 清楚 地 
说 明 在 多 层 网 络 中 所 能 做 的 选择 ， 包 括 应 用 和 数据 库 服 务 器 ， 不 同 层次 间 的 数据 库 分 布 
处 理 ， 以 及 使 用 浏览 器 的 瘦 客 户 ， 该 章 还 包括 一 些 重要 的 新 主题 ， 可 在 Web 中 使 用 的 数 
据 库 的 安全 性 、ODBC 和 JDBC 连 接 (包括 访问 JDBC 兼 容 数据 库 的 详细 的 代码 例子 )。 该 
章 继续 讨论 三 层 客户 /服务 器 体系 结构 ， 应 用 分 割 ， 大 型 主机 的 作用 ， 并 行 计算 机 体系 结 
构 的 使 用 ， 中 间 件 以 及 Microsoft Access 2000 的 按 例 查询 。 同 时 论述 和 比较 了 对 称 多 处 理 
(SMP) 和 大 规模 并 行 处 理 体系 结构 。 

。 第 10 章 ”这 是 新 的 一 章 ， 目 的 是 描述 使 用 web 的 应 用 到 数据 库 的 连接 。 该 章 包括 对 脚本 
语言 和 脚本 语言 中 的 代入 式 SQL 的 讨论 ， 并 包括 了 一 个 简单 购物 车 应 用 程序 ， 它 用 ASP 
和 ColdFusion 两 种 方法 实现 (在 本 书 的 网 站 中 可 以 找到 所 有 代码 )。 该 章 还 讨论 因特网 相 
关 的 术语 和 连接 网 页 和 数据 库 必须 理解 的 概念 〈 如 防火 墙 、 代 理 最 务 器 、 静 态 和 动态 网 
页 、HTML/SGML/XMLXHTML 语 言 、 层 和 登 样式 表 、 公 共 网 关 接 口 以 及 servlet) 。 该 章 解 
释 了 Web 服 务 器 的 作用 和 数据 库 连 接 的 服务 器 端 扩展 ， 同 时 涵盖 Web 的 安全 性 问题 和 隐 
私 问题 。 

“第 11 章 ”在 这 一 章 中 ， 修 订 了 第 5 版 中 的 大 部 分 内 容 。 目 的 是 描述 数据 仓库 的 基本 概念 。 
数据 仓库 被 许多 企业 认为 是 取得 竞争 优势 的 关键 因素 ， 是 数据 仓库 中 特有 的 数据 库 设 计 
活动 和 结构 。 该 章 的 主题 包括 : 各 种 可 选 的 数据 仓库 体系 结构 、 数 据 转换 和 数据 一 致 的 
技术 ,以 及 用 于 数据 仓库 的 多 维 数据 模型 ( 星 型 模式 )。 定义 了 运作 数据 存储 、 依 赖 数据 
集 市 、 独 立 数据 集 市 、 膛 辑 数据 集 市 以 及 各 种 形式 的 联机 分 析 处 理 。 该 章 最 大 的 变化 是 
讨论 数据 集 市 的 数据 库 设计 的 几 节 内 容 ， 解 释 和 举例 说 明了 代理 键 、 事 实 表 粒度 、 日 期 
和 时 间 建 模 、 维 的 一 致 性 ， 以 及 帮助 者 /层次 /引用 表 ， 也 讨论 了 OLAP 和 数据 控 掘 的 用 户 
界面 。 

第 五 部 分 ”数据库 的 高 级 主题 

“第 12 章 ”该 章 充分 讨论 数据 管理 和 数据 库 管理 的 重要 性 ， 并 论述 执行 这 些 功 能 会 出 现 的 
一 些 关 键 问题 ;强调 数据 管理 和 数据 库 管理 的 方法 和 改变 的 角色 ， 着 重 强调 调整 数据 库 
和 查询 ， 以 提高 性 能 。 该 章 充 分 讨论 数据 库 备 份 过程 、 数 据 安全 威胁 和 响应 ， 并 详细 讨 
论 数 据 质 量 的 管理 。 为 更 好 地 了 解 恢复 和 并 发 控制 ， 该 章 加 入 了 对 事务 完整 性 的 讨论 。 
该 章 继续 强调 在 将 管理 的 数据 作为 企业 资源 时 ， 数 据 和 数据 管理 的 重要 性 。 

“第 13 童 ”该 章 介绍 分 布 式 数据 库 的 作用 、 技 术 以 及 数据 库 设计 时 机 。 该 章 扩 充 和 更 新 对 
分 布 数据 库 的 目标 和 权衡 策略 、 数 据 复制 策略 、 选 择 数据 分 布 策略 的 因素 、 分 布 式 数据 
库 供 应 商 和 产品 。 该 章 及 第 12 章 充分 讨论 了 数据 库 并 发 访问 控制 。 

“第 14 童 ”该 章 采 用 Booch、Jacobson 和 Rumbaugh 的 统一 建 模 语言 介绍 面向 对 象 建 模 。 该 
章 进行 了 很 大 的 修改 以 介绍 最 新 UML 表 示 方 法 ， 使 用 UMEL 提 供 的 行业 标准 的 符号 表示 类 
和 对 象 。 该 章 继续 强调 基本 OO 概念 ， 诸 如 继承 和 聚合 ， 并 包括 扩展 的 松 谷 家 具 公 司 的 
OO 数据 模型 的 例子 。 
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。 第 15 章 ”该 章 的 目的 是 阐述 如 何 将 面向 对 象 模型 (在 第 14 章 中 介绍 ) 转换 为 面向 对 象 数 
据 库 管理 系统 的 类 、 对 象 、 关 系 和 操作 定义 。 该 章 也 介绍 了 ODBM 的 标准 语言 ， 即 对 象 
定义 语言 (ODL) 和 对 象 查 询 语言 (OQL) 的 最 新 格式 ， 包 含 使 用 ODL 描 述 的 松 谷 家 具 
公司 数据 库 的 面向 对 象 数据 库 定义 。 该 章 最 后 介绍 了 ODBM 的 主要 供应 商 和 产品 。 

附录 
本 书包 括 四 个 附录 ， 目 的 是 让 希望 学 习 这 些 主题 的 读者 能 够 进一步 了 解 相 关内 容 。 
“附录 A 这 个 新 的 附录 满足 了 很 多 读者 的 需求 ， 即 如 何 将 本 书 使 用 的 E-R 表 示 方 法 转换 为 
课堂 使 用 的 CASE 工 具 或 DBMS 所 用 的 表示 方法 。 该 附录 比较 了 Visible Analyst 7.4、 
ERwin 3.5.2、Microsoft Access 2000 和 Oracle Designer 6.0 所 使 用 的 表示 方法 。 附 录 中 的 
表 和 插图 说 明 对 于 同一 结构 ， 每 一 个 流行 软件 包 所 使 用 的 表示 方法 。 
* 附录 B 该 附录 描述 (使 用 例子 ) Boyce-Codd 范 式 和 第 四 范式 。 该 附录 还 增加 了 关于 
BCNEF 的 例子 ， 说 明 如 何 处 理 交 登 候 选 键 。 
。 附 录 C 该 附录 描述 了 数据 库 实 现 常 用 的 几 种 数据 结构 。 主 题 包括 指针 、 栈 、 队 列 、 排 序 
表 、 反 向 表 和 树 。 
“附录 D ”该 附录 描述 了 对 象 - 关 系数 据 库 管理 系统 (ORDBMS )。 主 题 包括 ORDBMS 的 特 
性 、 扩 展 的 SQL、 对 象 - 关 系 方法 的 优点 ， 以 及 ORDBMS 供 应 商 和 产品 的 总 结 。 


教学 


本 书 在 各 章 的 最 后 进行 一 系列 补充 和 改进 ， 为 用 户 提供 了 更 广泛 、 更 丰富 的 选择 。 最 重要 
的 改进 如 下 : 

1) 复习 问题 ”该 节 包括 与 问题 和 练习 中 的 问题 配套 的 练习 。 此 外 ， 还 加 入 很 多 新 的 问题 以 
巩 国 该 章 新 增加 的 内 容 。 

2) 问题 和 练习 ”该 节 在 每 一 章 都 有 所 扩展 ， 并 包含 很 多 新 的 问题 与 练习 ， 以 支持 更 新 的 章 
节 内 容 。 

3) 应 用 练习 ”该 节 提供 一 套 小 案例 ， 可 以 分 配给 每 个 学 生 或 学 生 小 组 来 完成 。 应 用 练习 的 
范围 从 指导 的 应 用 练习 到 因特网 搜索 以 及 其 他 类 型 的 研究 练习 。 

4) 项 目 娄 例 ”以 山 景 社区 医院 案例 作为 学 生 项 目 ， 本 书 已 经 为 新 的 和 扩充 的 章 创建 了 新 的 
案例 。 在 每 一 章 ， 项 目 案 例 都 以 与 该 章 内 容 相 关 的 一 个 简短 的 项 目 描述 开始 ， 然 后 给 出 一 系列 
需要 每 个 学 生 或 学 生 小 组 完成 的 项 目 问题 和 练习 。 该 项 目 给 学 生 提供 了 掌握 他 们 学 习 的 概念 和 
工具 的 有 效 手段 。 

5) Web 资 源 ”每 一 章 都 包含 补充 该 章 内 容 的 网 站 的 列表 和 有 用 的 信息 。 这 些 网 站 涵盖 了 在 
线 的 文献 、 厂 商 、 电 子 出 版 物 、 行 业 标 准 组 织 以 及 其 他 资源 。 这 些 网 站 能 够 使 学 生 和 教师 发 现 
更 新 的 产品 信息 ， 本 书 出 版 后 出 现 的 革新 ， 深 入 理解 主题 的 背景 信息 ， 并 可 作为 编号 研究 论文 
的 资源 。 

我 们 同时 更 新 了 教学 特色 ， 以 使 学 生 和 教师 广泛 接受 第 6 版 。 这 些 特色 如 下 : 

1) 学 习 目 标 “出 现在 每 一 章 的 开始 以 便 让 学 生 了 解 将 要 从 本 章 学 习 的 主要 概念 和 技巧 。 学 
生 在 准备 作业 和 考试 时 能 够 利用 学 习 目标 很 好 地 进行 复习 。 

2) 本 享 介绍 和 总 结 ”包含 每 一 章 的 主要 概念 和 相关 章节 的 链接 内 容 ， 为 学 生 提供 关于 课程 
的 全 面 的 概念 框架 。 

3) 本 章 复 习 ”包括 问题 回顾 、 问 题 与 练习 、 前 面 讨论 的 应 用 练习 ， 也 包含 关键 术语 以 测验 
学 生 对 基本 概念 、 基 本 事实 和 重要 问题 的 掌握 程度 。 





VII 


4) 不 断 出 现 的 术语 ”在 本 书 的 讨论 中 ， 会 出 现 许 多 关键 术语 的 定义 。 除 了 在 正文 中 解释 它 
们 外 ， 也 在 本 书 最 后 的 术语 表 中 给 出 了 这 些 术 语 的 定义 ， 附 录 中 同时 包括 数据 库 管 理 系统 中 常 
用 的 术语 缩写 。 


组 织 


我 们 鼓励 教师 定制 本 书 内 容 以 满足 学 生 学 习 的 需求 。 本 书 的 模块 化 的 特点 ， 广 泛 的 内 容 ， 
详细 的 说 明 ， 以 及 对 高 级 主题 和 新 问题 的 涵盖 使 得 定制 更 为 容易 。 对 现 有 文献 和 网 站 的 很 多 引 
用 使 教师 可 以 列 出 补充 的 读物 或 在 本 书 提供 的 资料 以 外 开展 讨论 。 几 个 高 级 主题 包含 在 附录 中 ， 
教师 可 以 根据 需要 讲授 或 略 过 这 些 主题 。 

本 书 的 模块 化 的 特点 使 教师 可 以 略 过 某 些 章节 或 以 不 同 的 顺序 进行 教学 。 例 如 ， 和 希望 重点 
讲授 数据 建 模 的 教师 可 以 讲授 关于 面向 对 象 数据 建 模 的 第 14 章 以 及 第 3 章 和 第 4 章 (也 可 以 不 讲 
授 这 两 章 )。 和 希望 仅 教授 基本 实体 -联系 概念 〈 但 不 包括 扩展 的 实体 -联系 模型 和 业务 规则 ) 的 
教师 可 以 跳 过 第 4 章 。 


补充 包 


本 书 英文 原 书 配 有 下 列 教师 资源 : 

教师 资源 CD-ROM 教师 资源 CD-ROM 上 县 有 下 列 特色 : 

* Instructor's Resource Manual ”提供 各 章 的 教学 目标 、 教 师 思想 以 及 复习 问题 、 问 题 和 练 

习 、 应 用 练习 、 项 目 案 例 问 题 的 答案 。Instructor's Resource Manual 也 可 以 打印 出 来 或 从 

本 首 网 站 上 的 “Faulty Area” 中 获取 。 

。Test Item File 或 Windows PH Test Manager 包括 一 大 ,综合 的 测试 问题 ， 其 中 有 多 项 选择 、 

真 假 判 断 ， 以 短 问题 格式 按照 问题 的 难 易 程 度 分 级 ， 并 且 按 照 原 书 的 页 码 和 标题 顺序 出 

现 。Test Item File 可 以 打印 、 在 IR CD-ROM 上 以 Microsoft Word 格 式 存储 并 且 可 用 于 计算 

机 化 Prentice Hall 测 验 管理 工具 。Test Manager 是 用 于 测验 和 评估 的 综合 的 工具 集 。 使 教师 

很 容易 创建 和 发 布 课程 的 测验 ， 可 用 通过 打印 并 以 传统 的 方式 发 布 或 通过 局 域 网 服务 器 

在 线 发 布 。Test Manager 提 供 屏 幕 向 导 以 帮助 读者 使 用 该 程序 ， 并 提供 充分 的 技术 支持 。 

。PowerPoint 幻 灯 片 突出 关键 的 术语 和 概念 。 教师 可 以 加 入 自己 的 幻灯 片 或 编辑 现 有 的 幻 

灯 片 对 其 进行 定制 。 

* 图 像 库 按 章 组 织 的 文本 。 其 中 包括 可 以 使 用 的 所 有 的 图 、 表 和 屏幕 快照 。 

“ 伴随 的 数据 库 ”为 本 书 编写 的 两 个 版 本 的 松 谷 家 具 公 司 案例 。 一 个 版 本 匹配 于 本 书 的 样 

例 。 另 一 个 版 本 中 包含 用 Visual Basic 编 写 的 表单 、 报 表 和 模块 。 该 版 本 并 不 完全 ， 这 样 

学 后 可 以 创建 所 缺 的 表 、 额 外 的 表 、 报 表 和 模块 。 其 中 也 包括 山 景 社区 医院 的 初步 版 本 。 

数据 库 中 还 包括 Oracle 脚 本 ， 用 于 创建 表 ， 插入 松 谷 家 具 公 司 和 山 景 社区 医院 的 样 例 数 

据 。 南 佛罗里达 大 学 的 Robert Lewis 为 我 们 创建 了 数据 集 和 应 用 。 该 数据 库 文件 在 教师 次 

源 CD-ROM 中 以 及 本 书 网 站 的 教师 区 内 可 以 找到 。 

本 书 的 网 站 在 本 书 的 网 站 (http://www.prenhall.com/hoffer) 中 包含 下 列 内 容 : 

1) 可 用 于 Access 和 Oracle 的 全 新 的 关于 松 谷 家 具 公司 案例 和 山 景 社区 医院 案例 的 数据 集 和 
样 例 数据 库 应 用 。 这 部 分 内 容 在 安全 的 Instructor's Area 内 提供 。 

2) 还 有 多 项 选择 、 判 断 、 讨 论 问题 的 交互 学 习 ] 指 导 。 学 生 在 回答 问题 后 可 得 到 自动 反馈 。 
在 学 生 完成 测验 后 ， 讨 论 问题 的 回答 、 多 项 选择 的 结果 、 真 假 问题 的 判断 都 可 以 通过 电子 邮件 
发 给 教师 。 
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3) Web Resources 模 块 包括 本 书 中 各 章 后 引用 的 Web 链 接 ， 以 帮助 学 生 通过 Web 进 一 步 探 索 
数据 库 管理 的 主题 。 

4) 网 站 的 学 生 区 包括 了 每 一 章 的 PowerPoint 演 示 。 

5) 按 字母 顺序 排列 和 按 章 节 排 列 的 完整 的 术语 表 ， 以 及 术语 缩写 。 

6) 网 站 中 加 入 了 新 的 案例 研究 。 一 些 案例 可 作为 学 期 的 课程 设计 。 其 他 一 些 可 作为 教学 案 
例 。 随 着 时 间 的 推移 ， 还 会 加 入 新 的 案例 。 
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第 一 部 分 包含 两 章 , 这 两 章 介 绍 了 数据 库 环境 并 给 出 以 后 将 用 到 的 数据 库 基本 概念 和 定义 。 
在 这 部 分 里 ， 我 们 将 数据 库 管 理 描绘 为 一 个 快速 增长 、 充 满 挑 战 而 激动 人 心 的 领域 ， 它 为 信息 
系统 专业 的 学 生 提 供 大 量 就 业 机 会 。 数 据 库 日 益 成 为 日 常生 活 中 不 可 或 缺 的 部 分 和 商务 运作 的 
更 核心 的 部 分 。 从 个 人 数字 助理 (PDA) 中 存储 联系 信息 的 数据 库 到 支撑 整个 企业 信息 系统 的 
大 型 数据 库 ， 数 据 库 已 经 成 为 几 十 年 前 人 们 所 预料 的 数据 存储 的 中 枢 。 客 户 关 系 管 理 和 因特网 
购物 是 近 几 年 发 展 起 来 的 两 个 依赖 于 数据 库 活 动 的 例子 。 

第 1 章 介绍 数据 、 数 据 库 、 元 数据 、 数 据 仓 库 、 内 部 网 (intranet) 、 外 部 网 (extranet) 和 
与 数据 库 环境 有 关 的 其 他 术语 的 定义 。 我 们 将 数据 库 和 已 被 取代 的 老 的 文件 管理 系统 作 比较 
并 描述 使 用 周密 规划 的 数据 库 能 够 获得 的 显著 优势 。 本 章 描述 个 人 、 工 作 组 、 部 门 、 企 业 、 
因特网 /内 部 网 /外 部 网 数据 库 的 典型 数据 库 应 用 及 其 特征 。 企 业 数 据 库 包括 企业 资源 规划 系统 
和 数据 仓库 。 我 们 还 描述 数据 库 环境 的 主要 组 成 部 分 ， 这 些 组 成 部 分 将 在 以 后 各 章 中 进行 更 
详细 的 阐述 。 最 后 ， 我 们 将 简要 介绍 数据 库 系统 (包括 对 象 - 关 系数 据 库 系统 和 支持 Web 的 系 
统 ) 的 发 展 历 史 ， 以 及 驱动 它们 发 展 的 动力 。 这 一 章 引用 了 松 谷 家 具 公司 的 例子 ， 用 来 说 明 
数据 库 管理 的 许多 原理 和 概念 。 这 个 例子 作为 数据 库 管理 系统 应 用 的 一 个 连续 的 例子 还 会 在 
以 后 各 章 使 用 。 

第 2 章 描 述 在 数据 库 的 分 析 、 设 计 、 实 现 和 管理 中 所 遵循 的 一 般 步骤 。 这 一 章 也 阐述 数据 
库 开发 过 程 如 何 适应 整个 信息 系统 开发 过 程 ， 解 释 数据 库 开发 的 结构 化 生命 周期 法 和 原型 法 。 
该 章 还 介绍 企业 数据 建 模 ， 它 设 定 组 织 数据 库 的 范围 和 一 般 内 容 ， 因 此 ， 它 常常 是 数据 库 开 
发 的 第 一 步 。 该 章 同 时 介绍 信息 系统 体系 结构 的 概念 ， 它 可 用 来 作为 组 织 信息 系统 的 蓝图 。 
我 们 还 将 描述 和 解释 信息 工程 ， 它 是 用 来 建立 和 维护 信息 系统 的 面向 数据 的 方法 学 。 数 据 库 
开发 中 的 问题 ， 包 括 数 据 库 开 发 中 的 各 种 人 员 的 管理 和 理解 数据 库 体系 结构 及 技术 的 框架 也 
在 该 章 中 进行 了 描述 。 

在 这 一 章 我 们 描述 和 解释 系统 开发 生命 周期 以 及 另 一 个 迭代 开发 过 程 即 原型 法 的 应 用 ， 阅 
述 在 信息 系统 开发 过 程 中 使 用 计算 机 辅助 软件 工程 (CASE) 工具 和 信息 库 的 重要 性 ， 介 绍 作 
为 现代 数据 库 系 统 中 主流 方法 的 模式 和 三 层 模式 体系 结构 的 概念 。 最 后 ， 我 们 描述 数据 库 开发 
项 目 中 经 常 出 现 的 各 种 人 员 的 角色 。 

在 第 一 部 分 中 ， 重 要 的 是 清楚 地 理解 所 提出 的 各 种 不 同 的 概念 和 定义 。 这 些 概念 和 定义 将 
贯穿 本 书 的 其 余部 分 。 为 了 保证 充分 理解 这 些 概念 和 定义 ,应 完成 每 章 后 的 若干 复习 题 和 练习 ， 
并 就 不 清楚 的 地 方 请 教 老 师 。 





第 1 章 ”数据 库 环境 


1.1 学 习 目 标 
学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 
“定义 下 列 关键 术语 : 数据 库 、 数 据 、 数 据 库 管理 系统 、 信 息 、 元 数据 、 企 业 数据 模型 、 
企业 资源 规划 系统 、 外 部 网 、 内 部 网 、 遗 留 数据 、 数 据 库 应 用 、 数 据 仓库 、 数 据 独立 性 、 
信息 库 、 用 户 视图 和 约束 。 
" 解释 数据 库 的 数量 为 什么 能 持续 增长 。 
“列举 出 常规 文件 处 理 系统 的 若干 局 限 性 。 
* 识别 五 类 数据 库 及 必须 对 每 一 类 数据 库 作 出 的 关键 决定 。 
“与 传统 文件 处 理 相 比 较 ， 说 明 数 据 库 方法 的 至 少 六 个 优点 。 
* 指出 数据 库 方法 的 若干 代价 与 风险 。 
* 列 出 并 简要 说 明 典 型 数据 库 环 境 的 九 个 组 成 部 分 。 
* 简要 描述 数据 库 系 统 的 演变 。 


1.2 引言 


在 过 去 20 年 中 ， 数 据 库 应 用 的 数量 和 重要 性 的 巨大 增长 是 有 目 共 睹 的 。 包 括 商业 、 医 疗 、 
教育 、 政 府 和 图 书馆 在 内 的 几乎 每 一 类 组 织 都 用 数据 库存 储 、 处 理 和 检索 数据 。 数 据 库 技术 一 
般 由 个 人 用 在 个 人 计算 机 上 ， 由 工作 组 用 在 网 络 服务 器 上 访问 数据 库 以 及 由 企业 范围 分 布 式 应 
用 系统 的 所 有 员工 使 用 。 

在 数据 库 应 用 的 快速 增长 期 之 后 ， 对 数据 库 和 数据 库 技 术 的 需求 是 否 将 趋 于 平稳 ”当然 不 
是 。 在 21 世 纪 初 的 高 度 竞争 环境 中 ， 种 种 迹象 表明 数据 库 技 术 将 更 加 重要 。 管 理 者 为 了 在 竞争 
中 获得 利益 ， 将 寻求 使 用 来 源 于 数据 库 的 知识 。 例 如 ， 可 以 通过 挖掘 详细 的 销售 数据 库 以 决定 
顾客 购物 模式 ， 并 将 其 作为 广告 和 市 场 促销 的 基础 。 当 前 许多 组 织 为 了 这 类 决策 支持 应 用 正在 
构筑 称 为 “数据 仓库 ”的 单独 的 数据 库 (Lambert，1996 )。 

使 用 数据 库 来 支持 客户 关系 管理 、 在 线 购物 和 员工 关系 管理 显得 日 益 重要 。 对 于 当前 大 多 
数 信息 系统 ， 从 个 人 数字 助理 和 信息 电器 中 的 小 型 数据 库 到 支持 企业 范围 信息 系统 的 大 型 数据 
库 ， 数 据 库 都 是 它们 的 基础 。 

尽管 数据 库 的 未 来 是 确定 的 ,但 仍 有 许多 工作 要 做 。 在 许多 组 织 中 , 不 相 容 的 数据 库 激增 ， 
这 些 数据 库 是 为 满足 当时 的 需要 而 开发 的 ， 但 并 没有 基于 良好 的 规划 ， 也 未 对 其 演化 过 程 进 行 
有 效 的 管理 。 大 部 分 数据 限制 在 更 老 的 “遗留 ”系统 中 ， 且 数据 质量 常常 很 差 。 数 据 仓 库 的 设 
计 也 需要 新 技术 ， 在 诸如 数据 库 分 析 、 数 据 库 设计 、 数 据 管理 、 数 据 库 管 理 领 域 所 用 的 技术 还 
存在 关键 性 缺陷 。 本 书 将 陈述 这 些 问题 和 其 他 重要 问题 。 

数据 库 管理 课程 是 现代 信息 系统 全 部 课程 中 最 重要 的 课程 之 一 。 作 为 一 名 专业 的 信息 系统 
人 员 ， 必 须 在 信息 系统 开发 的 过 程 中 去 分 析 数 据 库 需 求 ， 设 计 和 实现 数据 库 。 还 必须 与 终端 用 
户 交 流 ， 向 他 们 说 明 如 何 使 用 数据 库 (或 数据 仓库 ) 去 建立 能 在 竞争 中 获得 优势 的 决策 支持 系 
统 和 高 层 管理 人 员 信 息 系 统 。 为 了 给 网 站 用 户 返 回 动态 信息 ， 支 持 网 站 的 数据 库 已 得 到 广泛 应 
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用 ， 这 不 仅 需 要 了 解数 据 库 如 何 连 接 到 网 络 ， 而 且 应 该 了 解 如 何 保障 这 些 数据 库 的 安全 ， 即 它 
们 的 内 容 可 以 浏览 但 不 能 被 外 界 用 户 不 受 约束 地 获取 。 

本 章 介绍 数据 库 和 数据 库 管 理 系 统 (DBMS) 的 概念 ， 阐 述 传统 文件 管理 系统 及 它们 的 一 些 
缺点 ， 并 以 此 引出 数据 库 方法 。 本 章 描述 数据 库 应 用 的 范围 ， 从 个 人 计算 机 和 数字 助理 到 工作 
组 、 部 门 和 企业 数据 库 。 接 下 来 介绍 使 用 数据 库 方法 的 益处 、 代 价 和 风险 。 最 后 ， 本 章 总 结 了 
数据 库 系统 的 发 展 历史 及 构造 、 使 用 和 管理 数据 库 的 常用 技术 。 本 章 的 内 容 将 在 本 书 以 后 各 章 
中 详细 讨论 。 


1.3 基本 概念 和 定义 


数据 库 (database) 是 逻辑 相关 的 数据 的 有 组 织 的 集合 。 一 个 数据 库 可 以 具有 任意 大 小 和 
任意 复杂 度 。 例 如 ， 推 销 员 可 以 在 他 的 笔记 本 电脑 上 维护 关于 顾客 联系 方式 的 几 兆 字 节 数据 的 
小 型 数据 库 ， 一 个 大 公司 可 以 在 用 于 决策 支持 应 用 的 大 型 主机 上 构造 拥有 几 太 字 节 (1 太 字 节 
= 1 万 亿 字 节 ) 数据 的 巨型 数据 库 (Winter，1997)。 巨 型 数据 仓库 包含 超过 一 拍 字 节 (1 拍 字 
节 = 车 万 亿 字 节 ) 的 数据 (全书 假设 所 有 数据 库 都 是 基于 计算 机 的 )。 

1.3.1 数据 

企 历史 上 ， 术 语 数 据 (data) 是 能 记录 和 存储 在 计算 机 媒介 上 的 已 知事 实 。 例 如 ， 在 推销 
员 的 数据 库 中 ， 数 据 可 以 包括 诸如 顾客 姓名 、 地 址 和 电话 号 码 的 事实 。 现 在 应 该 扩展 这 个 定义 
以 反映 新 的 现实 。 除 了 传统 的 文本 和 数值 数据 外 ,当今 的 数据 库 也 可 以 存储 诸如 文件 、 照 片 、 
声音 甚至 视频 段 等 对 象 。 例 如 ， 推 销 员 的 数据 库 可 以 包括 顾客 的 照片 ， 还 可 以 包括 最 近 与 顾客 
联系 的 录音 或 视频 剪辑 。 为 了 反映 这 个 新 现实 ， 我 们 使 用 以 下 的 扩展 定义 : 数据 由 用 户 环境 中 
有 意义 的 事实 、 文 本 、 图 形 、 图 像 、 声 音 和 视频 构成 。 

我 们 已 将 数据 库 定义 为 相关 数据 的 有 组 织 的 集合 。 所 谓 有 组 织 (organized) 是 指数 据 是 结 
构 化 的 ， 以 便 用 户 可 以 方便 地 存储 、 操 纵 和 检索 。 所 谓 相 关 (related) 是 指数 据 为 -- 组 用 户 措 
述 了 他 们 感 兴趣 的 领域 ， 这 组 用 户 能 够 利用 这 些 数据 回答 有 关 该 领域 的 问题 。 例 如 ， 汽 车 修理 
商店 的 数据 库 包 含 能 够 识别 跨 客 (其 数据 项 包括 顾客 姓名 、 地 址 、 单 位 电话 、 家 庭 电话 及 信用 
卡号 ) 及 其 汽车 (其 数据 项 包括 制造 商 、 型 号 和 年 份 ) 以 及 每 辆 车 的 维修 史 ( 例如， 维修 日 期 、 
维修 人 员 姓 名 、 维 修 类 型 和 维修 费用 ) 的 数据 。 

1.3.2 数据 与 信息 

术语 数据 与 信息 是 紧密 相关 的 ， 事 实 上 它们 经 常 可 以 互 换 使 用 。 然 而 ， 区 分 数据 和 信息 通 
常 是 有 意义 的 。 我 们 定义 信息 (information) 为 以 能 够 增加 使 用 者 知识 的 方式 处 理 的 数据 。 例 
如 ， 考 虑 下 列 事实 : 
CC 


Baker, Kenneth D. 324917628 
Doyle, Joan E. 476193248 
Finkle, Clive R. 548429344 
Lewis, John C. 551742186 
McFerran, Debra R. 409723145 


Sisneros, Michael 392416582 
CC 


这 些 事实 符合 数据 的 定义 ， 但 大 多 数 人 认为 这 种 形式 的 数据 是 无 用 的 。 即 使 可 以 猜 出 这 是 
带 有 社会 安全 号 的 人 名 列表 ， 这 些 数 据 还 是 无 用 的 ， 因 为 不 知道 这 些 条 目 意味 着 什么 。 注意， 
当 我 们 把 相同 的 数据 置 于 某 种 语 境 之 中 (如 图 1-1a 所 示 ) 时 发 生 了 什么 。 通 过 增加 少量 附加 数 
据 项 和 提供 若干 结构 ， 我 们 可 以 看 出 这 是 一 门 课程 的 一 个 班级 花 名 肌 。 它 对 于 一 些 用 户 ， 例 如 





课程 教师 和 注册 办 公 室 工作 人 员 来 说 是 有 用 的 。 

将 数据 转换 为 信息 的 另 一 种 方式 是 汇总 这 些 数 据 ， 或 者 为 了 人 们 的 解释 而 处 理 和 描述 这 些 
数据 。 例 如 ， 图 1-1b 显 示 了 以 图 形 信息 表示 的 汇总 的 注册 学 生 数据 。 这 个 信息 可 作为 决定 是 否 
增加 新 课程 或 雇用 新 教员 的 基础 。 

在 实际 中 ， 按 照 我 们 的 定义 ， 目 前 的 数据 库 可 以 包括 数据 或 信息 (或 两 者 兼 有 )。 例 如 ， 
一 个 数据 库 可 以 包括 如 图 1-1a 所 示 的 班级 花 名 册 文 档 。 通 常 还 可 以 对 数据 进行 预 处 理 ， 并 以 汇 
总 形式 存储 在 用 于 决策 支持 的 数据 库 中 。 在 本 书 中 ， 我 们 使 用 数据 库 这 一 术语 时 不 区 分 其 内 容 
是 作为 数据 还 是 信息 。 


班级 花 和 名册 


课程 : MGT 500 学 期 : Spring 200X 
Business Policy 


班级 : 2 
姓名 ID 


Baker, Kenneth D. 324917628 
Doyle, Joan E. 476193248 
Finkle, Clive R. 548429344 
Lewis, john C. 551742186 
McFerran, Debra R. 409723145 
Sisneros, Michael 392416582 





a) 在 某 种 诸 境 下 的 数据 


= 实际 的 


Pr = 估计 的 
300 va 人 
学 和 
生 200 
数 
100 





1996 1997 1998 1999 2000 2001 


年 份 
己 注 册 的 革 业 所 占 的 卢 分 比 历年 招 牛 计划 


biL 总 的 数据 
图 1-1 转换 数据 为 信息 

1.3.3 元 数据 

前 面 说 到 过 ， 数 据 只 有 处 在 一 定 的 语 境 中 才 会 有 意义 。 为 数据 提供 语 境 的 主要 机 制 是 元 数 
据 。 元 数据 (metadata) 是 一 种 描述 其 他 数据 的 性 质 或 特征 的 数据 。 这 些 性 质 包括 数据 定义 、 
数据 结构 和 规则 或 约束 。 

表 1-1 列 出 班级 花 名 册 (图 1-1a) 的 样本 元 数据 。 对 于 班级 花 名 册 中 的 每 一 个 数据 项 ， 元 数 
据 显示 该 数据 项 的 数据 名 、 数 据 类 型 、 长 度 、 人 允许 的 最 小 值 和 最 大 值 (在 需要 的 地 方 给 出 ) 以 
及 每 个 数据 项 的 简要 描述 。 注 意 数据 和 元 数据 之 间 的 区 别 : 元 数据 是 从 数据 中 提取 出 来 的 ， 也 
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就 是 说 ， 元 数据 描述 数据 的 性 质 但 不 包括 数据 。 因 此 ， 表 1-1 显 示 的 元 数据 不 包括 图 1-1a 所 示 
的 班级 花 名 册 的 任何 样本 数据 。 


表 1-1 班级 花 名 册 的 样本 元 数据 





数据 项 
























Course 课程 ID 和 名 称 
Section 整数 1 班 全 

Semester 人 字 扩 数字 : 10 学 期 和 人 年份 

Name 宁 二 数字 30 学 牛 姓 名 

ID 整数 9 学 后 ID(SSN) 

Major 字母 数字 学 后 区 业 

GPA 二 进 制 数 学 上 生 学 分 平均 积分 点 







1.4 传统 文件 处 理 系统 


基于 计算 机 的 数据 处 理 的 初期 是 没有 数据 库 的 。 塞 满 了 几 个 大 房间 的 计算 机 的 性 能 比 现 在 
的 个 人 计算 机 还 差 得 多 ， 它 们 几乎 均 专门 用 于 科学 和 工程 计算 。 计 算 机 逐渐 地 被 引入 到 商业 
领域 。 为 了 用 于 商业 应 用 ， 计 算 机 必须 能 够 存储 、 操 纵 和 检索 大 量 数 据 文件 。 于 是 ， 计 算 机 
文件 处 理 系统 应 运 而 生 。 几 十 年 来 ， 虽 然 这 些 系统 有 所 发 展 ， 但 它们 的 基本 结构 和 目标 几乎 
没有 改变 。 

由 于 商业 应 用 变 得 更 加 复杂 ， 传 统 的 文件 处 理 系统 所 存在 的 许多 缺点 和 局 限 性 (在 后 文中 
介绍 ) 也 凸显 出 来 。 因 此 ,在 当今 最 关键 的 商业 应 用 中 ,数据 库 处 理 系 统 取 代 了 文件 处 理 系统 。 
由 于 下 列 原 因 ， 对 于 文件 处 理 系统 至 少 应 有 一 定 的 了 解 : 

1) 现在 ， 文 件 处 理 系 统 仍 在 广泛 使 用 ， 特 别 是 数据 库 备 份 系统 。 

2) 理解 文件 处 理 系统 中 国有 的 问题 和 局 限 性 能 够 帮助 我 们 在 设计 数据 库 系统 时 避免 同样 的 
问题 。 . 

本 节余 下 部 分 通过 实例 描述 文件 处 理 系统 并 讨论 它们 的 局 限 性 。 下 节 用 同样 的 例子 介绍 数 
据 库 处 理 系统 并 作 比较 。 

1.4.1 松 谷 家 具 公 司 的 文件 处 理 系统 

松 谷 家 具 公司 制造 高 质量 的 全 木 家 具 并 分 销 到 全 国 范围 各 零售 商店 。 在 该 公司 的 若干 产品 系 
列 中 有 计算 机 桌 、 娱 乐 中 心 用 具 、 餐 厅 家 具 、 书 枉 和 可 在 墙壁 安装 的 家 具 。 顾 客 通 过 电话 、 邮 件 、 
传真 或 因特网 向 松 谷 家 具 公 司 提交 订单 。 该 公司 目前 拥有 约 100 名 员工 ， 并 正在 快速 增长 。 

松 谷 家 具 公 司 的 早期 计算 机 应 用 使 用 传统 的 文件 处 理 方法 。 此 时 ， 信 息 系 统 的 设计 重点 集 
中 在 某 个 部 门 的 数据 处 理 需求 上 ， 而 不 是 评估 组 织 的 整体 信息 需求 。 信 息 系统 组 对 于 用 户 对 新 
系统 的 需求 ， 通 常 是 依靠 开发 (或 获得 ) 特定 应 用 所 需 的 计算 机 程序 来 满足 的 ， 这 些 应 用 包括 
库存 控制 、 应 收 账户 和 人 力 资 源 管理 。 所 开发 的 每 个 应 用 程序 或 系统 都 要 符合 特定 部 门 或 用 户 
组 的 需求 。 因 而 不 存在 指导 应 用 增长 的 全 面 蓝图 、 计 划 或 模型 。 

图 1-2 显 示 了 基于 文件 处 理 方法 的 三 个 计算 机 应 用 。 图 中 说 明 的 系统 是 Order Filling (订单 
填写 )、Invoicing (开发 票 ) 和 Payroll (薪资 )。 该 图 也 显示 了 与 每 个 应 用 有 关 的 主要 数据 文件 。 
文件 是 相关 记录 的 集合 。 例如， 订单 填写 系统 有 三 个 文件 : 顾客 主 文件 、 库 存 主 文件 和 退回 订 
单 文件 。 注 意 ， 在 三 个 应 用 中 所 有 的 文件 都 存在 部 分 重复 ， 这 在 文件 处 理 系统 中 是 常见 的 。 
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图 1-2 松 谷 家 具 公 司 的 三 个 文件 处 理 系 统 


1.4.2 文件 处 理 系统 的 缺点 
传统 的 文件 处 理 系统 存在 若干 全 点 。 表 1.2 列 出 了 这 些 铅 点 ， 下 面 将 分 别 说 明 这 些 缺 点 。 
1. 程序 -数据 依赖 性 
文件 描述 存储 在 每 一 个 访问 该 文件 的 应 用 程序 可 1 文件 处 理 系统 的 负 点 


中 。 例 如 ， 在 图 1-2 的 开发 票 系统 中 ， 程 序 A 不 但 可 程序 -数据 依赖 性 
以 访问 库存 价格 文件 ， 还 可 以 访问 顾客 主 文件 。 ie 
此 , 在 程序 中 包含 一 个 关于 这 两 个 文件 的 详细 描述 。 开发 时 间 长 
结果 ， 对 文件 结构 作出 的 任何 改变 都 需要 改变 访问 过 多 的 程序 维护 
该 文件 的 所 有 程序 的 文件 描述 。 


注意 图 1-2， 订 单 填写 系统 和 开发 票 系统 都 使 用 了 顾客 主 文件 。 假 设 决 定 在 该 文件 中 将 记 
录 的 顾客 地 址 字段 长 度 从 30 个 字符 改变 为 40 个 字符 。 受 影响 的 每 个 程序 (5 个 文件 ) 中 的 文件 
描述 都 不 得 不 加 以 修改 。 确 定 受 这 种 改变 影响 的 全 部 程序 是 很 困难 的 。 更 糟 的 是 ， 进 行 改变 时 
遂 常 会 引入 错误 。 

2. 数据 重复 

由 于 在 文件 处 理 系统 中 应 用 程序 常常 是 独立 开发 的 ， 所 以 通常 都 会 出 现 无 计划 的 重复 数据 
文件 。 例 如 ， 在 图 1-2 的 订单 填写 系统 包含 了 库存 主 文件 ， 同 时 ， 开 发 票 系统 包含 了 库存 价格 文 
件 ， 这 些 文件 毫 无 疑问 地 包含 了 描述 松 谷 家 具 公 司 产品 的 数据 ， 诸 如 产品 描述 、 价 格 和 现 有 数 
量 。 这 个 重复 是 多 余 的 ， 因 为 它 需要 附加 存储 空间 ， 同 时 ， 为 使 所 有 文件 保持 最 新 状态 还 要 增 
加 工作 量 。 更 为 其 者 ， 重 复数 据 文件 常 导致 数据 完整 性 丢失 ， 这 是 由 于 数据 格式 可 以 不 一 致 或 
数据 值 可 以 不 一 致 ( 或 两 者 兼 有 )。 如 此 无 计划 和 无 控制 的 元 余 也 导致 元 数据 完整 性 的 丢失 。 例 
如 ， 在 不 同 的 文件 中 相同 数据 项 可 以 有 不 同 的 名 字 或 相同 名 字 在 不 同文 件 中 用 于 不 同 数据 项 。 

3. 数据 共享 有 限 

在 传统 文件 处 理 方法 中 ， 每 个 应 用 都 有 它 自 己 专用 的 文件 ， 用 户 不 大 可 能 共享 自己 应 用 之 
外 的 数据 。 例如， 在 图 1-2 中 ， 财 务 部 的 用 户 可 以 访问 开发 票 系统 及 其 文件 ， 但 他 们 可 能 不 访 
问 订 单 填写 系统 或 薪资 系统 及 其 文件 。 如 果 需 要 一 份 报告 ， 那 么 就 要 进行 大 量 的 编程 工作 才能 





事 1/ 划 ”发 据 府 球 堪 7 


得 到 不 同系 统 中 若干 不 兼容 文件 的 数据 ， 这 将 使 管理 者 很 头疼 。 此 外 ， 由 于 不 同 的 组 织 单位 可 
以 有 自己 不 同 的 文件 ， 所 以 在 管理 工作 上 也 要 花费 较 大 的 精力 。 

4. 开 发 时 间 长 

使 用 传统 的 文件 处 理 系统 ， 在 前 一 个 阶段 中 的 成 果 不 大 可 能 在 后 面 的 阶段 中 得 到 重用 。 每 
个 新 应 用 都 要 求 开 发 者 必须 从 设计 新 文件 的 格式 和 描述 开始 ， 然 后 编写 每 个 新 程序 的 文件 访问 
逻辑 。 元 长 的 开发 时 间 与 当今 快速 发 展 的 商业 环境 极 不 协调 ， 现 在 ， 市 场 时 机 (或 对 于 信息 系 
统 的 产品 时 机 ) 是 关键 的 商业 成 功 因 素 。 

5. 过 多 的 程序 维护 

前 面 所 有 因素 的 组 合 使 依赖 传统 文件 处 理 系统 的 组 织 产 生 了 沉重 的 程序 维护 负担 。 事实 上 ， 
在 这 样 的 组 织 中 ， 整 个 信息 系统 开发 预算 的 几乎 80% 是 用 在 程序 维护 上 。 这 几乎 未 留 下 开发 新 
应 用 的 机 会 。 

需要 注意 的 是 ， 如 果 一 个 组 织 没 有 适当 地 应 用 数据 库 方法 ， 那 么 我 们 提 到 的 文件 处 理 的 许 
多 缺点 也 可 能 成 为 数据 库 的 局 限 。 例 如 ， 一 个 组 织 开发 了 许多 各 自 独 立 的 没有 元 数据 配合 的 管 
理 数 据 库 (比如 说 ， 为 每 个 部 门 或 业务 职能 部 门 创建 一 个 数据 库 )， 那 么 无 控制 的 数据 重复 、 
有 限 的 数据 共享 、 宛 长 的 开发 时 间 和 过 多 的 程序 维护 也 存在 。 因 而 ， 下 一 节 讲 述 的 数据 库 方法 
间 样 是 一 种 管理 组 织 的 数据 的 方法 ， 它 是 一 组 定义 、 创 建 、 维 护 和 使 用 数据 的 技术 。 


1.5 数据 库 方法 


数据 库 方法 强调 整个 组 织 (或 至 少 组 织 的 大 部 分 部 门 ) 数据 的 集成 和 共享 。 这 个 方法 要 求 
在 思考 过 程 中 ,需要 从 顶层 管理 开始 ， 改 变 考虑 问题 的 方向 或 转换 考虑 问题 的 角度 。 这 样 的 改 
变 对 于 大 多 数组 织 来 说 是 困难 的 ， 然 而 许多 组 织 正在 作 这 种 转换 并 认识 到 信息 可 以 作为 一 种 竞 
争 的 武器 。 
松 谷 家 具 公 司 的 数据 库 方法 

20 世 纪 90 年 代 初期 ,家 具 制 造 业 的 竞争 日 趋 激烈 ， 竞 争 者 对 于 新 商机 的 反应 似乎 比 松 谷 家 
具 公 司 更 快 。 虽 然 造成 这 种 状况 有 许多 原因 ， 但 管理 者 感到 他 们 曾经 使 用 的 (基于 传统 的 文件 
处 理 ) 计算 机 信息 系统 已 经 过 时 了 。 公 司 开始 采用 数据 库 方法 进行 开发 。 本 章 简要 描述 此 方法 ， 
第 2 章 将 作 更 详细 的 描述 。 

1. 企业 数据 模型 

松 谷 家 具 公司 在 转换 到 数据 库 方法 的 第 一 步 是 列 出 支持 该 公司 业务 活动 的 高 层 实体 。 实 体 
(entity ) 是 一 个 对 业务 十 分 重要 的 对 象 或 概念 。 松 谷 家 具 公 司 涉及 的 一 些 高 层 实体 有 : 
CUSTOMER (顾客 )、PRODUCT (产品 )、EMPLOYEE ( 员工)、CUSTOMER ORDER ( 顾 
客 订单 ) 和 DEPARTMENT (部 门 )。 

确定 和 定义 了 这 些 实体 后 ， 公 司 继续 开发 企业 数据 模型 。 企 业 数 据 模型 (enterprise data 
model) 是 一 个 显示 该 组 织 的 高 层 实体 及 实体 间 联 系 的 图 形 化 模型 。 图 1-3 展 示 了 包含 4 个 实体 
和 3 个 有 关 关 联 的 企业 实体 模型 片段 。 该 模型 片段 中 表示 的 实体 是 : 

“CUSTOMER 购买 或 将 来 可 能 购买 松 谷 家 具 公 司 产品 的 个 人 和 团体 。 

“ORDER 顾客 购买 产品 的 订单 。 

* PRODUCT 松 谷 家 具 公 司 制造 和 和 销售 的 产品 。 

“ORDER LINE 茶 个 顾客 所 购 每 件 产 品 的 明细 (例如 ， 数 量 和 价格 )。 

图 中 表示 的 关联 (数据库 术语 中 称 为 联系 ， 即 连接 实体 的 3 条 线 ) 捕获 了 3 个 基本 业务 规则 ， 
如 下 所 示 : 
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1) 每 个 CUSTOMER ( 蜂 客 ) 可 以 提交 许多 份 ORDER (订单 )。 相 反 ， 每 份 ORDER (订单 ) 
只 能 由 一 个 CUSTOMER (顾客 ) 提交 。 

2) 每 份 ORDER (订单 ) 包含 许多 ORDER LINE (i 订单 明细 )。 相 反 ， 每 个 ORDER LINE 
(订单 明细 ) 只 能 包含 在 一 份 ORDER (订单 ) 中 。 

3) 每 个 PRODUCT (产品 ) 可 有 许多 ORDER LINE (订单 明细 )。 相 反 ， 每 个 ORDER 
LINE (订单 明细 ) 只 能 针对 一 个 PRODUCT (产品 )。 

这 里 的 “提交 ”(Place)、“ 可 有 ”(Has) 和 “包含 ”(Contain ) 称 为 一 对 多 联系 ， 因 为 一 
个 顾客 潜在 地 可 提交 多 份 订单 ， 而 一 份 订单 只 能 属于 一 个 顾客 。 

图 1-3 所 示 的 这 类 图 称 为 实体 -联系 图 (entity-relationship diagram )。 实 体 - 联 系 (E-R) 图 
在 数据 库 应 用 中 非常 重要 ， 第 3 章 和 第 4 章 专门 介绍 这 类 模型 。 第 3 章 描述 基本 E-R 图 和 数据 建 
模 (data modeling)， 第 4 章 描 述 高 级 数据 建 模 。 这 两 章 还 将 描述 各 类 业务 规则 ， 以 及 规则 的 获 
取 方 法 和 建 模 方法 。 


CUSTOMER PRODUCT 


人 小 js placed by 


Contains 





图 1-3 企业 数据 模型 片段 ( 松 谷 家 具 公 司 ) 


注意 ， 企 业 数据 模型 有 下 列 特点 : 

1 这 是 一 个 提供 了 关于 组 织 功能 的 有 用 信息 和 重要 限制 的 组 织 模型 。 

2) 通过 关注 实体 、 联 系 和 业务 规则 ， 企 业 数据 模型 强调 数据 和 处 理 的 集成 (integration ) 
业务 规则 。 

2. 关系 数据 库 

经 过 初步 学 习 ， 我 们 可 以 确信 数据 库 方法 在 管理 上 有 许多 潜在 的 优点 。 该 公司 决定 实现 以 
表格 形式 查看 所 有 数据 的 现代 关系 数据 库 管理 信息 系统 (第 5 章 讲 述 关系 数据 库 )。 图 1-4 显 示 
了 具有 样本 数据 的 四 个 表 : Customer 表 、Product 表 、Order 表 和 Order_Line 表 。 这 些 表 也 表示 
企业 数据 模型 ( 见 图 1-3) 展示 的 四 个 实体 。 

表 的 每 一 列表 示 实 体 的 一 个 属性 (或 特征 )， 例 如 ，Customer 表 的 属性 有 Customer_ID、 
Customer_Name、Address、City、State 和 Postal_Code。 表 的 每 一 行 表 示 实 体 的 一 个 实例 (或 取 
值 )。 关系 模型 的 一 个 重要 性 质 是 它 通 过 存储 在 相应 表 的 列 的 值 表示 实体 间 的 关系 。 例如 ， 
Customer_ID 是 Customer 表 和 Order 表 的 一 个 公共 属性 。 因 此 ， 可 以 容易 地 将 订单 与 相应 的 顾客 
联系 起 来 。 再 例如 ， 可 以 确定 Order_ID3 与 Order_ID2 有 关 。 能 够 确定 哪个 Product_ID 与 
Order_ID2 有 关 呢 ? 以 后 的 各 章 将 介绍 如 何 使 用 有 效 的 查询 语言 从 这 些 表 中 检索 数据 。 

3. 关系 数据 库 的 实现 

数据 库 方 法 与 老 的 文件 处 理 系统 相 比 提供 了 许多 鹤 在 的 优点 。 然 而 ， 如 果 该 组 织 只 是 实现 
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一 系列 孤立 的 数据 库 , 那么 只 能 体现 其 中 的 少数 优点 , 因为 它 不 允许 组 织 


事实 上 ,孤立 的 数据 库 有 许多 与 文件 处 理 系统 相同 的 缺点 。 


: 


2 Coffe Tabie 

3 Computer Desk 
4 Enterainment Center 
5 Wrters Desk 

6 -Drawer Drasser 
7 #8" Bookcase 

3 45" Bookcase 

9 96" Bookctase 
10 96" Bookcass 
11 4-Drawer Dresser 
12 8- Drawer Dresser 
13 Nightstand 
14 Wrters Desk 


Buch 
Ok 
Maple 
Oak 
Burch 
Wainut 
Ow 
Wairnut 
Ok 
Dax 
Oak 
Cherry 
Buch 


1 Contemporary Casuals 
2 Value Fyniture 


3 Home Furntshings 
4 Eastem F urmture 
5 lImpressions 

6 Fumiture Galiery 


1355 S Hines Bivd 
15145 S W 17th SS 
1900 Allard Ave 
1925 Beitine Rd 
5585 Westcott Ct 
325 Fiatwron Dr 


b) Product 和 Customer 表 
图 1-4 四 个 关系 ( 松 谷 家 具 公 司 ) 


Ganesville 
Plane 
Aibany 
Carneret 
Sacramento 
Bouider 
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的 不 同 成 员 共 享 数据 。 
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为 了 方便 共享 数据 和 信息 ， 松 谷 家 具 公司 使 用 了 将 不 同 部 门 员工 的 工作 站 链接 到 数据 库 服 
务 器 的 局 域 网 (LAN ) ， 如 图 1-5 所 示 。 为 了 改善 企业 内 部 的 通信 和 决策 过 程 ， 建 立 了 使 用 基于 
Web 的 因特网 技术 和 仅 限 于 企业 内 部 访问 的 内 部 网 。 每 个 员工 的 工作 站 可 以 作为 Web 浏 览 器 ， 
快速 访问 包括 电话 号 码 矫 、 家 具 设 计 规格 、 电 子 邮 件 等 在 内 的 公司 信息 。 工 作 站 还 可 以 用 作 个 
人 计算 机 ， 并 根据 需要 通过 局 域 网 访问 数据 库 服 务 颖 。 

松 谷 家 具 公 司 期 望 在 它 的 业务 应 用 中 增加 一 个 Web 界 面 ， 例 如 ， 订 单 录入 页 面 ， 以 便于 更 
多 的 内 部 业务 活动 能 够 通过 内 部 网 进行 管理 。 他 们 还 计划 通过 因特网 使 顾客 的 访问 变 得 更 方便 。 
许多 销售 松 谷 家 具 公 司 家 具 系 列 的 家 具 零 售 商 希望 通过 因特网 访问 该 公司 ， 了 解 库 存 家 有 具 的 货 
源 。 然 后 ， 零 售 商 可 向 他 们 的 顾客 提供 这 方面 的 信息 。 向 零售 商 显 示 库 存 信 息 就 产生 了 信息 安 
全 问题 ， 这 将 在 第 12 章 陈述 ， 第 10 章 也 会 讨论 平台 问题 。 

尽管 数据 库 能 够 充分 支持 松 谷 家 有 具 公司 的 日 常 操作 ， 然 而 没 过 多 久 ， 经 理 们 就 发 现 同样 的 
数据 库 对 于 决策 支持 的 应 用 来 说 常常 是 不 充分 的 。 例 如 ， 通 过 数据 库 不 能 容易 地 回答 下 列 问题 : 

1) 与 去 年 同期 相 比 ， 今 年 销售 家 具 的 模式 是 什么 ? 

2) 谁 是 前 十 位 的 最 大 顾客 ”他 们 购买 的 模式 是 什么 ? 

3) 哪 类 家 具 趋 向 于 一 起 销售 (例如 ， 桌 子 与 椅子 ) ? 
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图 1-5 松 谷 家 具 公 司 的 计算 机 系统 


区 1 章 数据 库 球 声 yh 


为 了 回答 这 些 问 题 和 其 他 问题 ， 一 个 组 织 通 常 应 该 建立 一 个 包含 历史 和 汇总 信息 的 单 
独 的 数据 库 。 这 样 的 数据 库 通常 称 为 数据 仓库 (data warehouse ),， 或 有 时 称 为 数据 集 市 
(data mart)。 分 析 人 员 需 要 专门 的 决策 支持 工具 来 查询 和 分 析 数 据 库 。 用 于 此 目的 的 一 类 
工具 称 为 联机 分 析 处 理 (或 OLAP) 工具 。 第 11 章 将 阐述 数据 仓库 、 数 据 集 市 和 决策 支持 
有 

4. 数据 库 应 用 

数据 库 应 用 是 一 个 应 用 程序 (或 一 组 相关 程序 )， 它 常常 代表 数据 库 用 户 执行 一 系列 活动 。 
每 个 数据 库 应 用 执行 下 列 一 些 基本 操作 : 

1) 创建 (create) 增加 新 数据 到 数据 库 。 

2) 读 取 (read) ” 读 取 当前 数据 库 数据 (常常 以 有 用 的 形式 表现 在 计算 机 屏幕 或 打印 好 的 
报表 上 )。 

3) 更 新 (update) 更 新 (或 修改 ) 当前 数据 库 数 据 。 

4) 删除 (delete) ”从 数据 库 删除 当前 数据 。 

松 谷 家 具 公 司 的 重要 数据 库 应 用 之 一 是 创建 顾客 发 票 。 当 订单 准备 送 达 顾客 时 ， 相 应 的 发 
票 也 准备 好 了 ， 该 发 票 汇总 所 有 的 订单 项 并 计算 出 总 额 。 图 1-6 显 示 了 一 个 典型 的 顾客 发 票 。 
除非 原始 的 订单 发 生 改变 ， 和 否则 根据 数据 库 (参见 图 1-4) 中 的 数据 自动 生成 发 票 。 
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图 1-6 顾客 发 票 ( 松 谷 家 具 公司 ) 
1.6 数据 库 应 用 的 范围 


数据 库 应 用 范围 可 涉及 从 具有 台式 计算 机 或 个 人 数字 助理 的 单个 用 户 到 拥有 数 千 用 户 的 大 
型 计算 机 。 数 据 库 应 用 范围 可 以 分 为 五 类 : 个 人 数据 库 、 工 作 组 数据 库 、 部 门 数据 库 、 企 业 数 
据 库 和 因特网 、 内 部 网 和 外 部 网 数据 库 。 以 下 通过 典型 例子 介绍 每 一 类 数据 库 应 用 。 





12 菜 一 部 分 数据 摩 念 理 语 卉 





1.6.1 个 人 数据 库 

个 人 数据 库 是 专用 于 某 一 个 用 户 的 。 个 人 数据 库 常 驻 留 于 包括 笔记 本 电脑 在 内 的 个 人 计算 
机 (PC) 中 。 近 来 ,个 人 数字 助理 (PDA ) 的 出 现 将 个 人 数据 库 和 手持 设备 结合 起 来 ， 不 仅 
具有 计算 设备 的 功能 ， 而 且 可 作为 蜂窝 电话 、 传 真 (FAX ) 机 和 Web 浏 览 器 使 用 。 存 有 顾客 信 
息 和 每 个 顾客 详细 联系 方式 的 简单 数据 库 应 用 能 够 用 于 PC 或 PDA ， 并 可 容易 地 从 一 个 设备 转 
移 到 另 一 个 设备 ， 以 便 进 行 备 份 和 其 他 工作 。 例 如 ， 考 虑 一 个 拥有 许多 销售 员 的 公司 ， 这 些 销 
售 员 访 问 现 有 或 未 来 顾客 。 如 果 每 个 销售 员 还 有 其 他 应 用 ， 例 如 ， 一 个 包含 很 多 图 形 的 销售 演 
示 程 序 和 一 个 帮助 销售 员 为 顾客 定货 而 确定 物品 类 型 和 数量 最 佳 组 合 的 定价 程序 ， 由 于 存储 和 
性 能 的 需求 ， 应 当 使 用 一 台 笔 记 本 电脑 。 假 如 销售 员 只 需要 保存 他 们 的 联系 人 列表 ， 那 么 一 合 
使 用 小 型 数据 库 、 具 有 联系 管理 应 用 的 PDA 可 能 是 最 佳 的 。 图 1-7 显 示 了 顾客 联系 人 列表 的 典 
型 数据 。 

顾客 

顾客 姓名 : 

Mutlti Media, Inc. 


地 址 : 
1000 River Road 






















城市 : 
San Antonio 





电话 : 
(219) 864-2000 
下 次 联系 日 期 : 
10/17/2000 








时 间 : 
10:30 AM 
与 顾客 联系 的 历史 记录 


















08/04/2000 | 10:00 AM 审阅 计划 : 


: 书 
修订 时 间 表 


计划 
09/10/2000 
09/21/2000 Roberts | 监督 工作 进展 


图 1-7 到 自 个 人 数据 库 的 典型 数据 

在 开发 个 人 数据 库 时 ， 必 须 作 出 的 若干 关键 决定 是 : 

1) 该 应 用 是 从 供应 商 处 购买 还 是 组 织 自行 开发 ? 

2) 如 有 打数 据 库 应 用 是 内 部 开发 ， 那 么 它 该 是 由 终端 用 户 开发 还 是 由 信息 系统 (IT) 部 门 的 
专业 人 员 开 发 ? 

3) 用 户 需要 什么 数据 ?数据库 如 何 设计 ? 

4) 该 应 用 应 使 用 什么 样 的 商业 数据 库 管理 系统 (DBMS ) 产品 ? 

5) 个 人 数据 库 中 的 数据 如 何 与 其 他 数据 库 中 的 数据 同步 ? 
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6) 谁 来 负责 个 人 数据 库 中 的 数据 准确 性 ? 

个 人 数据 库 之 所 以 广泛 使 用 ， 这 是 因为 它 常常 能 够 提高 个 人 生产 率 。 然 而 ， 它 必然 伴 有 风 
险 : 数据 不 能 容易 地 与 其 他 用 户 共 享 。 例 如 ， 销 售 经 理想 要 一 个 顾客 联系 人 的 完整 视图 ， 而 这 
个 视图 不 能 很 快 地 或 方便 地 从 某 个 销售 员 的 数据 库 中 产生 。 这 说 明 一 个 非常 普通 的 问题 : 如 果 
数据 对 于 一 个 人 来 说 是 有 用 的 ， 那 么 该 数据 对 于 其 他 人 来 说 也 可 能 (或 将 可 能 ) 是 有 用 的 。 因 
此 , 个 人 数据 库 应 仅 限 于 在 特定 情况 下 使 用 ， 即 个 人 数据 库 用 户 之 闻 共 享 数据 的 需求 较 少 ( 例 
如 ， 在 非常 小 的 组 织 中 )。 

表 1-3 工作 组 数据 库 示例 中 的 软件 对 象 列表 





Opbject Place7nc. 
400 Magnolia Sr. 
Atlanta, GA 02103 

















名 称 语 占 描述 价 格 
123Xtender Visual Basic 电子 去 格 包装 器 595 
DSSObjects C++ 决策 支持 后 成 器 595 
ObjectSuite Smalltalk 6 个 普通 对 象 集 5000 
OrderObject Smalltalk 普通 订单 对 象 1000 
PatientObject Smalltalk 普通 病人 对 象 1000 


1.6.2 工作 组 数据 库 

工作 组 (workgroup) 是 指 在 同一 项 目 或 应 用 中 ， 或 者 一 组 类 似 项 目 或 应 用 中 合作 的 相对 
较 少 的 一 组 人 员 。 通 常 工作 组 的 人 数 不 超 过 25 人 。 这 些 人 可 能 从 事 ( 例 如) 建筑 项 目 或 开发 新 
的 计算 机 应 用 。 工 作 组 数据 库 用 来 支持 这 组 人 协同 工作 。 

考虑 一 个 开发 标准 对 象 和 定制 对 象 (或 软件 组 件 ) 并 出 售 给 软件 商 或 终端 用 户 的 工作 组 。 
表 1-3 是 一 份 近来 开发 的 软件 对 象 列表 。 通 常 是 一 个 或 多 个 人 在 给 定时 间 内 为 开发 指定 的 对 象 
或 组 件 而 工作 。 这 组 人 需要 一 个 数据 库 ， 该 数据 库 将 跟踪 开发 过 程 中 每 一 事项 并 允许 工作 组 成 
员 方 便 地 共享 数据 。 

图 1-8 显 示 了 在 数据 库 中 共享 数据 的 方法 。 每 个 工作 组 成 员 都 有 一 台 笔 记 本 电脑 并 通过 局 
域 网 (LAN ) 连接 起 来 。 数 据 库存 储 在 与 局 域 网 连接 的 称 为 数据 库 服务 器 (database server) 
的 中 央 设 备 中 。 因 此 ， 每 个 工作 组 成 员 都 可 以 访问 共享 数据 。 不 同类 型 的 组 成 员 (例如 ， 开 发 
者 或 项 目 经 理 ) 可 以 有 该 共享 数据 库 的 不 同 用 户 视图 。 注 意 ， 这 种 安排 克服 了 PC 数据 库 的 数 
据 不 容易 共享 (至 少 ， 数 据 不 容易 在 工作 组 内 共享 ) 的 主要 缺陷 。 然 而 ， 这 种 安排 产生 了 许多 
在 个 人 【 单 用 户 ) 数据 库 中 不 存在 的 数据 管理 问题 ， 例 如 ， 数 据 安全 性 和 并 发 用 户 数据 更 新 时 
的 数据 完整 性 。 由 于 一 个 组 织 由 许多 工作 组 构成 ， 个 别人 在 同一 或 不 同时 间 可 以 是 许多 不 同 工 
作 组 的 一 部 分 ， 所 以 产生 许多 数据 库 是 可 能 的 ， 这 和 个 人 数据 库 的 情况 相同 。 

在 建立 工作 组 数据 库 时 ， 组 织 必须 回答 建立 个 人 数据 库 时 的 相同 问题 。 此 外 ， 还 出 现 了 下 
列 数 据 库 管 理 问题 : 

1) 如 何 设 计数 据 库 才 能 最 优 地 满足 许多 工作 组 成 员 的 信息 需求 ? 

2) 不 同 成 员 如 何 能 够 并 发 使 用 数据 库 而 不 破坏 数据 库 完整 性 ? 

3) 哪些 数据 库 处 理 操作 应 在 工作 站 运行 ?哪些 应 在 服务 器 运行 ? 

1.6.3 部 门 数 据 库 

部 门 《department) 是 一 个 组 织 内 的 职能 单位 。 部 门 的 典型 例子 有 人 事 部 、 营 销 部 、 后 产 

部 和 财务 部 。 一 般 说 来 ， 部 门 比 工作 组 规模 大 通常 有 25 ~ 100 人 ) 并 负责 更 多 不 同 的 职能 。 








库 管理 员 








局 域 网 


数据 库 









工作 组 数据 库 
图 1-8 局 域 网 上 工作 组 数据 库 


部 门 数 据 库 应 支持 部 门 的 各 种 不 同 的 职能 和 活动 。 它 们 是 本 节 描 述 的 五 类 数据 库 中 最 常见 
的 一 类 。 例如， 考虑 一 个 记录 有 关 员 工 、 工 作 、 技 能 和 工作 分 配 的 人 事 数据 库 。 一 旦 有 关 数 据 
存 入 数据 库 ， 那 么 用 户 就 能 够 查询 数据 库 并 得 到 下 列 问题 的 答案 : 

1) 对 于 特定 的 工作 分 类 (例如 ， 软 件 工程 师 )， 公 司 里 目前 存在 何 种 工作 机 会 ? 

2) 对 于 同一 工作 分 类 ， 需 要 哪些 工作 技能 ? 

3) 特定 的 员工 应 该 具有 什么 技能 ? 相反 地 ， 哪 些 员工 应 该 具有 特定 技能 (例如 ，C++ 程 序 
设计 )? 

4) 哪些 员工 被 分 配 了 特定 的 工作 ? 相反 地 ， 某 个 员工 的 工作 经 历 是 什么 ? 

5) 哪些 员工 受 某 个 经 理 管理 ? 

在 设计 和 实现 部 门 数据 库 时 ， 必 须 解 决 的 典型 问题 ( 除 已 经 描述 的 外 ) 如 下 : 

1) 假设 存在 大 量 用 户 和 用 户 事务 ， 为 达到 足够 性 能 ， 数 据 库 及 其 环境 应 如 何 设计 ? 

2) 为 了 防止 非 授权 汽 露 或 敏感 数据 外 传 ， 应 如 何 提供 足够 的 安全 性 ? 

3) 在 这 复杂 的 环境 中 应 该 使 用 什么 样 的 数据 库 和 应 用 开发 工具 ? 

4) 其 他 部 门 是 否 也 在 维护 相同 类 型 的 数据 ， 如 果 是 这 样 ， 如 何 能 够 最 好 地 管理 数据 宛 余 、 
数据 一 致 性 和 元 数据 ? 

5) 是 否 数据 库 用 户 在 地 理 上 分 散 或 数据 库 规模 很 大 ， 以 至 于 数据 必须 存储 在 若干 个 计算 机 
系统 中 ， 于 是 ， 必 须 创 建 分 布 式 数据 库 (distributed database) 吗 ? 

1.6.4 企业 数据 库 

企业 数据 库 是 一 个 范围 包括 整个 组 织 或 企业 (或 至 少 是 许多 不 同 部 门 ) 的 数据 库 。 这 样 的 
数据 库 支 持 组 织 范围 的 运作 和 决策 制定 。 注 意 ， 一 个 组 织 可 以 有 若干 个 企业 数据 库 ， 因 此 ， 这 
种 企业 数据 库 不 包括 整个 组 织 的 数据 。 由 于 超大 型 数据 库 性 能 上 的 局 限 、 不 同 用 户 的 不 同 要求 
和 为 所 有 数据 库 用 户 实 现 单一 数据 (元 数据 ) 定义 的 复杂 性 ， 所 以 单一 的 、 运 行 的 企业 数据 库 
对 于 许多 中 到 大 型 的 组 织 是 不 可 行 的 。 然 而 ， 企 业 数据 库 确 实 应 该 支持 不 同 部 门 的 信息 需求 。 
近 十 年 间 企业 数据 库 的 演变 导致 了 两 方面 的 主要 发 展 : 

1) 企业 资源 规划 系统 。 

2) 数据 仓库 实现 。 

企业 资源 规划 (ERP) 系统 从 20 世 纪 70 年 代 到 20 世 纪 80 年 代 的 材料 需求 规划 (MRP) 和 生 
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产 资源 规划 (MRP-I ) 演变 而 来 。MRP 系 统 安排 生产 过 程 的 原材料 、 组 件 和 零 部 件 的 需求 ， 
而 MRP- [系统 还 包括 车 间 调 度 和 产品 分 发 调度 。 后 来 ， 企 业 职能 的 扩展 促使 企业 范围 的 管理 
系统 ， 即 企业 资源 规划 系统 的 生成 。 所 有 ERP 系 统 都 强烈 地 依赖 于 数据 库 来 存储 ERP 应 用 所 需 
要 的 数据 。 

ERP 系 统 利用 企业 当前 运作 数据 进行 工作 。 数 据 仓 库 (data warehouse) 的 内 容 源 自 包括 个 
人 数据 库 、 工 作 组 数据 库 和 部 门 数 据 库 在 内 的 不 同 运作 数据 库 。 数 据 仓库 使 用 户 有 机 会 利用 历 
史 数 据 去 识别 模式 和 趋势 并 回答 商务 战略 方面 的 问题 。 第 11 章 将 详细 介绍 数据 仓库 。 

考虑 一 个 大 型 医疗 组 织 ， 它 拥有 若干 医疗 中 心 ， 包 括 医 院 、 诊 所 和 疗养 院 。 这 些 医 疗 中 心 
都 有 各 自 的 数据 库 (或 数据 库 组 ) 以 支持 该 组 织 的 运行 ， 如 图 1-9 所 示 。 这 些 数 据 库 包 括 有 关 
病人 、 医 生 、 医 疗 服务 、 商 务 运 作 和 其 他 有 关 事 项 的 数据 。 

数据 库 能 为 每 个 医疗 中 心 的 大 多 数 职能 提供 足够 支持 。 然 而 ， 该 组 织 认识 到 应 该 有 一 个 整 
个 组 织 的 数据 库 的 完整 视图 ， 如 可 以 查看 某 个 病人 或 供应 商 的 全 部 活动 。 例 如 ， 为 所 有 医疗 单 
位 集中 定货 以 及 跨 单位 进行 人 员 和 服务 调度 ， 能 够 获得 高 操作 效率 。ERP 系 统 使 得 这 种 方法 成 
为 可 能 。 公 司 制 定 决策 、 与 外 部 供应 商 (例如 保险 公司 ) 打交道 、 向 不 同 的 代理 商 报告 都 需要 
编辑 历史 数据 和 信息 。 为 了 满足 这 些 要 求 ， 组 织 创 建 了 在 公司 总 部 办 公 室 维护 的 数据 仓库 。 通 
过 从 个 别 数据 库 抽 取 和 汇总 数据 ， 将 数据 仓库 中 的 数据 定期 导出 ， 并 利用 远程 通信 网 络 将 这 些 
数据 传送 到 企业 的 数据 仓库 。 





图 1-9 一 个 企业 数据 仓库 











在 企业 数据 库 中 常 产生 的 若干 问题 如 下: 

1) 数据 应 该 如 何在 公司 结构 的 不 同位 置 传送 ? 

2) 组 织 如 何 开发 和 维护 关于 数据 名 字 、 定 义 、 格 式 及 有 关 事项 的 标准 ? 

3) 为 了 集成 包括 分 析 所 需 的 早先 系统 遗留 数据 (legacy data) 的 众多 系统 ， 必 须 采 取 什 么 
行动 ? 
1.6.5 因特网 、 内 部 网 和 外 部 网 数据 库 

影响 数据 库 环境 的 最 近 的 变化 是 因特网 的 增长 ， 因 特 网 是 一 个 很 容易 通过 Web 浏 览 器 界 
血 连 接 多 平台 用 户 的 世界 范围 的 网 络 。 在 商务 上 应 用 因特网 使 早已 建立 的 商务 模式 有 了 重大 
改变 。 曾 经 非常 成 功 的 公司 受到 了 新 企业 的 挑战 ， 这 些 新 企业 使 用 因特网 以 提供 改善 的 顾客 
信息 和 服务 ， 代 条 了 传统 的 营销 渠道 和 传送 渠道 并 实现 了 员工 关系 管理 。 顾 客 直 接 向 计算 机 
制造 商 选 配 和 订购 他 们 的 最 新 个 人 计算 机 。 航 空 公司 机 票 和 收藏 品 的 报价 在 提交 的 几 分 钟 后 
就 可 以 收 到 ， 有 时 可 以 节省 40% 以 上 的 时 间 。 关 于 招聘 和 公司 活动 的 信息 在 许多 公司 内 都 很 
容易 获得 。 

这 些 应 用 都 需要 数据 库 支持， 许多 应 用 需要 通用 访问 。 多 平台 的 方便 连接 允许 公司 重新 组 
织 他 们 的 运作 ， 并 且 更 快 、 更 低 成 本 地 开发 新 应 用 。 标 准 界面 允许 用 户 进 行 较 少 的 培训 和 较 少 
的 支持 就 可 以 轻松 使 用 。 开 发 实用 的 应 用 程序 的 核心 在 于 能 够 从 一 个 与 应 用 连接 的 数据 座 中 检 
索 当 前 信息 。 当 一 个 数据 库 是 支持 Web ( Web 数据 库 ) 的 ，Web 浏 览 器 界面 允许 用 户 询问 惟一 
的 和 特殊 的 问题 并 基于 当前 信息 获得 答案 。 这 些 问题 的 回答 是 由 程序 自动 完成 的 ， 不 需要 通过 
电话 进行 一 系列 选择 或 者 人 工 提供 帮 助 。Web 数 据 库 对 于 在 线 购物 站 点 的 开发 是 必 不 可 少 的 ， 
为 了 改善 客户 关系 管理 (CRM)， 公 司 正在 收集 有 关 其 顾客 的 信息 (购买 模式 、 站 点 导航 和 每 
个 屏幕 停留 时 间 等 )。 

上 面 所 引用 的 大 部 分 例子 反映 了 B2C 关 系 。 因 为 有 些 企业 的 客户 是 其 他 企业 ， 所 以 他 们 的 
相互 作用 通常 称 为 B2B 关 系 。 因 特 网 常用 于 B2C 联 系 ， 因 为 顾客 对 于 企业 来 说 必定 是 外 部 的 ， 
顾客 访问 企业 数据 或 信息 的 能 力 对 于 顾客 与 企业 之 间 的 成 功 联系 是 十 分 关键 的 。 允 许 这 种 外 部 
对 企业 数据 库 的 访问 会 为 信息 系统 管理 带 来 新 的 数据 安全 性 和 完整 性 问题 ， 因 为 通常 数据 被 严 
窗 保 护 在 每 个 企业 中 。 第 10 章 和 第 12 章 将 详细 讨论 这 些 问 题 。 

企业 多 年 来 利用 电子 数据 交换 (EDI) 取得 交易 信息 。 许 多 企业 继续 使 用 EDI 系 统 去 指导 
他 们 的 B2B 业 务 。 有 些 企 业 ， 特 别 是 新 企业 或 以 前 在 内 部 信息 交换 中 未 使 用 EDI 的 企业 ， 通 党 
建立 外 部 网 (extranet) 来 执行 B2B 交 换 。 外 部 网 使 用 因特网 技术 ， 但 是 ， 和 所 有 人 都 能 访问 
内 特 网 应 用 不 同 ， 外 部 网 不 是 任何 人 都 能 访问 的 。 更 确切 地 说 ， 访 问 仅 限于 拥有 合法 访问 权 
限 和 使 用 相互 数据 和 信息 协定 的 企业 供应 商 和 顾客 。 通 常 ， 这 些 供应 商 和 顾客 访问 内 部 网 
(intranet) 的 -- 部 分 (以 后 讨论 )。 这 种 访问 提供 对 信息 的 更 快 更 有 效 的 处 理 或 访问 ， 方 便 业 
务 关 系 。 

如 前 所 述 ， 许 多 公司 使 用 因特网 技术 建立 专用 网 以 便 为 组 织 进行 信息 管理 。 从 表面 上 看 ， 
内 部 网 页 面 与 内 特 网 页 面 类 似 ， 但 是 ， 对 页 面 的 访问 仅 限于 组 织 内 的 页 面 。 因 此 ， 对 于 公司 数 
据 库 的 访问 是 受 限制 的 。 内 部 网 也 能 够 建立 与 因特网 的 连接 ， 但 该 连接 受 防火 墙 保护 ， 以 防止 
外 部 用 户 与 内 部 网 连接 。 

1.6.6 数据 库 应 用 小 结 

本 万 描述 的 各 类 数据 库 应 用 的 小 结 如 表 1-4 所 示 。 访 表 显示 各 类 数据 库 的 典型 用 户 数 、 典 

型 数据 结构 (客户 /服务 器 (C/S) 结构 ， 在 第 9 章 介绍 ) 和 典型 数据 库 规模 的 范围 
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表 1-4 数据库 应 用 小 结 (改编 自 White，1995) 





数据 库 类 型 典 坦 用 户 数 典型 结构 数据 库 典 型 规模 
个 人 数据 库 1 台式 /笔记 本 电脑 、PDA MB 级 

三 作 组 数据 库 5 ~ 25 C/S {2 层 ) MB ~ GB 级 
部 门 数 据 库 25 ~ 100 C/IS (3 屋 ) GB 级 

企业 数据 库 > 100 CS (分 布 式 或 开行 服务 沉 ) GB ~ TB 级 
因特网 > 1000 web 服务 器 和 应 用 服务 器 MB ~ GB 级 


1.7 数据 库 方法 的 优点 
数据 库 方法 相 比 传统 的 文件 处 理 系统 提供 了 许多 玉 在 的 优点 。 主 要 优点 见 表 1-5， 下 面 将 


这 些 优点 概述 如 下 。 表 1-5 数据 库 方 法 的 优点 

1.7.1 程序 -数据 独立 性 下 i 
数据 描述 (元 数据 ) 和 使 用 该 数据 的 应 用 程序 nA 

分 离 称 为 数据 独立 性 (data independence )。 利 用 数 收 汶 数据 .任性 

据 库 方 法 ,数据 描述 存储 在 系统 信息 的 信息 库 改革 数据 此 家 

(repository) 中 。 数 据 库 系统 的 性 质 允 许 在 不 改变 提高 应 用 开发 的 生产率 

处 理 数据 的 应 用 程序 情况 下 ， 更 新 和 演变 组 织 的 数 ote 

据 (在 一 定 的 限度 内 )。 ph 


改 次 数据 可 访 辣 性 和 响应 性 
1.7.2 数据 元 余 度 最 小 减少 程序 维护 


数据 库 方法 的 设计 日 标 是 将 先前 单独 (或 元 余 ) 
的 数据 文件 集成 到 一 个 逻辑 结构 中 。 每 个 基本 事实 记录 在 数据 库 的 惟一 位 置 。 例 如 ， 
Product_ID 7 剖 是 一 合 价值 375 美 元 的 橡木 计算 机 隶 这 一 事实 存储 在 Product 表 中 (参见 图 
1-4b)。 数 据 库 方 法 不 会 完全 消除 元 余 性 ， 但 它 允 许 设计 者 小 心地 控制 元 余 的 类 型 和 数量 。 例 
如 ，Order 表 (图 1-4a) 中 的 每 份 订单 包含 了 Customer_ID 以 利于 建立 订单 与 顾客 之 间 的 联系 。 
有 了 时 也 可 包 插 一 些 有 限 的 元 余 以 改善 数据 库 性 能 ， 以 后 章节 将 看 到 这 种 情况 。 
1.7.3 改善 数据 一 致 性 

通过 消除 (或 控制 ) 数据 元 余 ， 极 大 地 减少 了 不 一 致 的 机 会 。 例 如 ， 假 如 顾客 地 址 只 存储 
一 次 ， 那 么 就 不 会 出 现存 储 值 不 一 致 的 情况 。 当 每 个 值 仅 存储 一 处 时 ， 修 改 数据 值 也 会 大 大 地 
简化 。 最 后 ， 避 免 了 元 余数 据 存储 所 造成 的 存储 空间 浪费 。 
1.7.4 改善 数据 共享 

数据 库 是 一 个 共享 的 、 共 同 的 资源 。 授 权 的 内 部 和 外 部 用 户 有 权 使 用 数据 库 ， 每 个 用 户 
(或 用 户 组 ) 都 可 以 有 一 个 或 多 个 用 户 视图 以 方便 使 用 。 用 户 视图 (user view) 是 用 户 执行 一 
些 任务 所 需要 的 数据 库 某 些 部 分 的 逻辑 描述 。 例 如 , 松 谷 家 具 公 司 数 据 库 的 每 一 个 表 ( 见 图 1-4) 
都 能 构成 一 个 用 户 视图 。 然 而 ， 用 户 视图 常常 是 这 样 一 个 表单 或 报表 ， 它 包含 了 来 自 多 个 表 的 
数据 。 例 如 ,顾客 发 票 ( 见 图 1-6) 也 是 该 数据 库 的 一 个 用 户 视图 。 在 松 谷 公司 的 网 站 上 可 获得 
的 产品 目录 是 另 一 个 用 户 视图 。 
1.7.5 提高 应 用 开发 的 生产 率 

数据 库 方 法 的 主要 优点 是 大 大 降低 了 开发 新 业务 应 用 的 成 本 和 时 间 。 数 据 库 应 用 比 传统 文 
件 应 用 开发 速度 快 得 多 的 两 个 重要 原因 是 : 

1) 假定 数据 库 、 相 关 数 据 的 获取 和 维护 应 用 已 经 设计 和 实现 ， 程 序 员 可 以 集中 精力 实现 新 
应 用 需要 的 特殊 功能 上 ， 而 不 必 担 心 文件 设计 或 低层 实现 细节 。 
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2) 数据 库 管理 系统 提供 了 许多 高 级 的 高 生产 率 工具 ， 例 如 表单 和 报表 生成 器 ， 以 及 能 使 数 
据 库 设计 和 实现 的 一 些 活动 自动 化 的 高 级 语言 。 在 随后 的 各 章 中 将 介绍 许多 这 类 语言 。 
1.7.6 标准 的 实施 

当 用 数据 库 方法 提供 全 面 的 管理 支持 时 ， 对 数据 库 管理 部 门 的 职能 应 予以 单一 授权 ， 并 责 
成 建立 和 实施 各 种 数据 标准 。 这 些 标 准 包括 命名 约定 、 数 据 质 量 标准 及 访问 、 修 改 和 保护 数据 
的 一 致 性 过 程 。 数 据 信息 库 为 数据 库 管理 员 提 供 一 组 开发 和 实施 标准 的 强 有 力 的 工具 。 但 是 ， 
不 能 实现 强 有 力 的 数据 库 管 理 功 能 或 许 是 组 织 的 数据 库 失 败 最 普遍 的 根源 。 第 12 章 将 介绍 数据 
库 管 理 ( 和 有 关 数 据 的 管理 ) 功能 。 
1.7.7 改善 数据 质量 

数据 质量 低劣 是 当今 数据 库 管理 的 普遍 问题 (Ballou 和 Tayi, 1999)。 数 据 库 方法 提供 了 许 
多 改善 数据 质量 的 工具 和 过 程 。 最 重要 的 是 以 下 两 点 : 

1) 数据 库 设 计 者 能 够 指定 由 DBMS 实 施 的 完整 性 约束 。 约 束 (constraint) 是 数据 库 用 户 不 
能 韦 这 的 规则 。 第 3 章 和 第 4 章 将 介绍 多 类 约束 (也 称 为 业务 规则 )。 

2) 数据 仓库 环境 的 上 月 标 之 一 是 在 将 数据 放 入 数据 仓库 之 前 清洗 (或 “擦洗 ”) 运作 数据 
(Jordan,1996)。 第 11 章 将 介绍 数据 仓库 及 其 改善 数据 质量 的 潜力 。 
1.7.8 改善 数据 可 访问 性 和 响应 性 

没有 程序 设计 经 验 的 终端 用 户 也 通常 能 够 利用 关系 数据 库 检索 和 显示 数据 ， 甚 至 跨越 传统 
的 部 门 界线 。 例 如 ， 员 工 使 用 下 列 查询 能 够 显示 松 谷 家 具 公 司 的 有 关 计 算 机 桌 的 信息 : 

SELECT * 

FROM PRODUCT 

WHERE Product Name = "Computer Desk"; 


该 查询 中 使 用 的 语言 称 为 结构 化 查询 语言 ， 简 称 为 SQL (第 7 章 、 第 8 章 将 详细 介绍 该 语言 )。 
1.7.9 减少 程序 维护 ， 

由 于 各 种 原因 ， 如 新 数据 类 型 的 加 入 、 数 据 格式 的 改变 等 等 ,存储 的 数据 必须 经 常 地 改变 。 
这 个 问题 的 著名 例子 是 有 名 的 “2000 年 ”问题 ， 即 将 常见 的 2 位 数字 年 字段 扩展 为 4 位 数字 以 适 
应 从 1999 年 到 2000 年 的 转变 。 

在 文件 处 理 环 境 中 ， 数 据 的 措 述 和 访问 数据 的 逻辑 内 嵌 在 某 个 应 用 程序 中 〈 这 是 前 面 所 述 
的 程序 -数据 依赖 性 问题 )。 因 此 ， 改 变数 据 格式 和 访问 方法 不 可 避免 地 造成 修改 应 用 程序 。 
在 数据 库 环 境 中 ， 数 据 更 多 地 独立 于 使 用 它 的 应 用 程序 。 在 某 个 限度 内 ， 我 们 可 以 改变 数据 
或 使 用 数据 的 应 用 程序 而 不 必 改 变 其 他 因素 。 所 以 ， 在 现代 数据 库 环 境 中 能 够 大 幅度 减少 程 
序 维护 。 

1.7.10 关于 数据 库 优 点 的 告诫 

本 节 介 绍 了 数据 库 方法 的 9 个 主要 潜在 优点 。 然 而 ， 必 须 提醒 你 的 是 ， 许 多 组 织 在 企图 实 
现 这 些 优点 时 却 失败 了 。 例 如 ， 由 于 老式 的 数据 模型 和 数据 库 管理 软件 的 限制 ， 数 据 独 立 性 的 
目标 (和 减少 程序 维护 ) 难以 达到 。 幸 好 ， 关 系 模型 (和 最 新 的 面向 对 象 模型 ) 为 实现 这 些 优 
点 提供 了 更 好 的 环境 。 未 能 成 功 实现 这 些 优点 的 另 一 个 原因 是 组 织 规划 和 数据 库 实现 低劣 ， 即 
使 最 好 的 数据 管理 软件 也 不 能 克服 这 样 的 不 足 。 因 此 ，、 我 们 在 下 文中 强调 数据 库 规划 和 设计 。 


1.8 数据库 方法 的 成 本 和 风险 


和 进行 任何 商业 决策 一 样 ， 在 实现 数据 库 方法 时 必须 认识 到 和 管理 某 些 附加 的 成 本 和 风险 
(参见 表 1-6)。 
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1.8.1 新 的 专门 人 员 表 1-6 数据 库 方法 的 成 本 和 风险 
采用 数据 库 方法 的 组 织 常常 需要 雇用 或 说 训 人 一  . 

员 去 设计 和 实现 数据 库 ， 提 供 数 据 库 管理 服务 以 及 雪 当 “生理 全 入 人 

管理 新 的 人 员 。 由 于 技术 的 快速 更 新 ， 这 些 新 员工 人 [成 不 和 复 估 人 

必须 再 训练 或 定期 更 新 知识 。 这 种 人 员 上 的 增加 可 涡 览 清晰 备份 和 恢复 

能 无 法 由 其 他 生产 率 的 增益 来 补偿 ， 但 是 ，- -个 组 组 织 冲突 


织 不 应 该 将 这 些 有 利于 获得 最 大 潜在 利益 所 需要 的 
专门 技术 的 需求 减 到 最 小 。 第 12 章 讨论 数据 库 管理 的 人 员 需 求 。 
1.8.2 安装 、 管 理 成 本 和 复杂 性 

多 用 户 数 据 库 管理 系统 是 一 组 大 型 、 复 杂 的 软件 ， 它 具有 很 高 的 初始 成 本 ， 需 要 训练 有 素 
的 人 员 去 安装 和 运行 ， 述 需要 大 量 的 维护 和 支持 费用 。 安 装 这 样 的 系统 还 可 能 需要 将 组 织 的 硬 
件 和 数据 通信 系统 升级 。 为 了 能 跟 上 新 版 本 和 升级 ， 通 常 需要 进行 大 量 培训 。 为 了 提供 安全 性 
并 保证 共享 数据 进行 恰当 的 并 发 更 新 ， 可 能 需要 另外 一 些 更 高 级 和 昂贵 的 数据 库 软件 。 
1.8.3 转换 成 本 

遗留 系统 (legacy system) 通常 是 指 组 织 中 老式 的 应 用 ， 它 基于 文件 处 理 或 老式 数据 库 技 
术 。 老 式 系统 到 现代 数据 库 技术 的 转换 成 本 一 一 以 美元 、 时 间 和 组 织 的 投入 度量 一 一 对 组 织 来 
说 常常 是 一 笔 很 大 的 负担 。 如 第 11 章 所 述 ， 使 用 数据 仓库 是 一 种 继续 使 用 老式 系统 而 同时 又 能 
开发 数据 库 技 术 的 策略 (Ritter，1999 )。 
1.8.4 需要 清晰 备份 和 恢复 

-个 共享 的 公司 数据 库 必 须 在 任何 时 间 都 是 准确 的 和 可 用 的 。 为 了 提供 备份 数据 并 在 发 生 
级 坏 时 恢复 数据 库 ， 就 要 求 开发 和 使 用 多 个 综合 过 程 。 通 常 ， 现 代数 据 库 管理 系统 完成 备份 和 
恢复 任务 的 自动 化 程度 比 文件 系统 更 高 。 第 12 章 将 介绍 安全 性 、 备 份 和 恢复 的 过 程 。 
1.8.5 组 织 冲 突 

共享 数据 库 要 求 数据 定义 和 所 有 权 一 致 ， 并 且 要 负责 准确 的 数据 维护 。 经 验 表 明 ， 在 数据 
定义 、 数 据 格式 和 编码 、 更 新 共享 数据 的 权利 及 有 关 问 题 上 的 冲突 很 常见 ,常常 是 很 难 解决 的 。 
处 理 这 些 问 题 需要 组 织 在 开发 数据 库 时 对 数据 库 方法 、 组 织 优秀 的 数据 库 管理 员 以 及 合理 的 演 
化 方法 方面 进行 巨大 的 投入 。 

如 果 缺 乏 对 数据 库 方法 的 强 有 力 的 顶级 管理 支持 和 投入 ， 单 独 数据 库 的 终端 用 户 开发 可 能 
大 幅度 增加 。 这 些 数据 库 不 遵循 我 们 描述 的 一 般 数 据 库 方法 ， 它 们 不 可 能 提供 前 面 所 述 的 优点 。 


1.9 数据 库 环境 的 组 成 部 分 


典型 数据 库 环境 及 其 联系 的 主要 组 成 部 分 如 图 1-10 所 示 。 前 面 已 经 介绍 了 一些 (不 是 全 部 ) 
组 成 部 分 。 以 下 对 图 1-10 中 的 9 个 组 成 部 分 作 简 要 描述 。 

1) 计算 机 辅助 软件 工程 (CASE) 工具 使 数据 库 和 应 用 程序 设计 自动 化 的 工具 。 本 书 将 
描述 CASE 工 具 在 数据 库 设 计 和 开发 中 的 应 用 。 

2) 信息 库 集中 了 全 部 数据 定义 、 数 据 联系 、 屏 幕 和 报表 格式 以 及 其 他 系统 组 成 部 分 的 知 
识 库 。 信 息 库 包含 一 个 扩展 的 元 数据 的 集合 ， 它 和 信息 系统 的 其 他 部 分 一 样 ， 对 于 数据 库 的 管 
理 是 非常 重要 的 。 第 12 章 将 介绍 信息 库 。 

3) 数据 库 管理 系统 (DBMS ) 一 个 用 于 定义 、 建 立 、 维 护 和 提供 对 数据 库 及 信息 库 的 有 
控制 访问 的 商业 软件 (偶尔 也 包括 硬件 和 固件 ) 系统 。 第 12 章 和 第 13 章 将 介绍 DBMS 的 功能 ， 

4) 数据 库 一 个 逻辑 上 相关 的 数据 的 有 组 织 的 集合 ， 通 常用 于 满足 组 织 内 多 个 用 户 的 信息 
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需要 。 重 要 的 是 区 分 数据 库 和 信息 库 。 信 息 库 包含 数据 的 定义 ， 而 数据 库 包含 数据 的 具体 值 。 
第 5 音 和 第 6 章 将 介绍 数据 库 的 设计 活动 。 第 7 章 - 第 11 章 将 介绍 数据 库 的 实现 。 

5) 应 用 程序 -个 用 来 建立 和 维护 数据 库 以 及 为 用 户 提供 信息 的 计算 机 程序 。 第 7 章 ~ 第 
11 音 将 介绍 主要 的 数据 库 程序 设计 技巧 。 : 

6) 用 户 界面 语言 、 菜 单 和 其 他 工具 ， 用 户 借助 它们 来 与 不 同 的 系统 组 成 部 分 (例如 ， 
CASE 工 具 、 应 用 程序 、DBMS 和 信息 库 ) 交互 。 用 户 界面 的 介绍 贯穿 全 书 。 

7) 数据 管理 员 负责 组 织 中 全 部 信息 资源 的 人 员 。 数 据 管理 员 使 用 CASE 工 具 提高 数据 库 
规划 和 设计 的 生产 率 。 第 12 章 将 详细 介绍 数据 管理 的 职能 。 

8) 系统 开发 人 员 例如 系统 分 析 员 和 设计 新 应 用 程序 的 程序 员 。 系 统 开发 人 员 常 常 使 用 
CASE 工 具 进 行 系统 需求 分 析 和 程序 设计 。 

9) 终端 用 户 ” 整 个 组 织 内 的 人 员 ， 他 们 增加 、 删 除 和 修改 数据 库 中 的 数据 ， 并 且 从 中 请 求 
或 接收 信息 。 用 户 与 数据 库 的 所 有 交互 活动 都 必须 通过 DBMS 进 行 。 

借助 软件 ， 用 户 界 面 变 得 越 来 越 友好 。 例 如 ， 菜 单 驱 动 系统 、 启 用 Web 的 系统 、 鼠 标的 使 
用 、 声 音 识 别 系统 。 这 些 系统 提高 了 终端 用 户 的 计算 能 力 ， 也 就 是 说 ， 不 是 计算 机 专家 的 用 户 
也 能 够 定义 他 们 自己 的 报表 、 显 示 和 简单 应 用 。 当 然 ， 在 这 样 的 环境 中 ， 数 据 库 管理 必须 保证 
实施 足够 的 安全 措施 以 保护 数据 库 。 

图 1-10 显 示 的 DBMS 运 行 环境 是 一 个 集成 系统 ， 它 包括 硬件 、 软 件 以 及 方便 存储 、 检 索 和 
控制 信息 资源 及 改善 组 织 生产 率 的 人 员 。 


数据 管理 员 系统 开发 人 员 


CASE 工 具 用 户 界 面 应 用 程序 





图 1-10 数据 库 环境 的 组 成 部 分 
1.10 数据 库 系统 的 演变 


数据 库 管 理 系统 最 早出 现在 20 世 纪 60 年 代 ， 并 在 随后 的 几 十 年 继续 发 展 。 图 1-11 概 述 了 这 
个 演变 ， 着 重 列 出 了 每 十 年 中 趋 于 前 沿 的 数据 库 技术 。 在 大 多 数 情况 下 ， 技 术 推广 的 时 期 是 相 
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当 长 的 ， 图 中 所 示 的 技术 在 其 被 采用 的 十 年 前 就 首次 提出 。 例 如 ， 关 系 模 型 首先 由 IBM 研 究 员 
E.F.Codd 企 1970 年 出 版 的 论文 中 定义 《Codd，1970)。 然 而 ， 关 系 模型 直到 20 世 纪 80 年 代 才 在 
商业 上 得 到 普遍 应 用 。 

数据 库 管 理 系统 的 开发 克服 了 前 面 所 述 的 文件 处 理 系统 的 局 限 。 总 之 ， 以 下 3 个 目标 总 会 
虹 动 数据 库 技 术 的 发 展 和 演变: 

1) 要 求 提 供 更 高 的 程序 和 数据 问 独 立 性 ， 从 而 减少 维护 成 本 。 

2) 管理 日 益 增长 的 复杂 数据 类 型 和 结构 的 要 求 。 

3) 为 那些 既 没 有 程序 设计 语言 基础 ， 又 不 十 分 了 解数 据 库 中 数据 如 何 存储 的 用 户 提供 更 容 
易 、 更 方便 访问 数据 的 要 求 。 
1.10.1 20 世 纪 60 年 代 

这 个 时 期 还 是 文件 处 理 系统 占据 主导 地 位 。 然 而 , 第 一 个 数据 库 管理 系统 在 这 个 时 期 引入 ， 
主要 用 于 大 型 的 和 复杂 的 高 风险 项 目 ， 例 如 阿波 罗 登 月 计划 。 我 们 将 这 个 阶段 看 作 实验 性 的 
“概念 证 明 ” 期 ， 验 证 用 DBMS 管 理 大 量 数据 的 可 行 性 。 在 20 世 纪 60 年 代 后 期 ， 随 着 数据 库 任 
务 组 的 成 立 ， 标 准 化 方面 的 工作 也 开始 展开 。 
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平面 文件 一 
局 次 的 一 一 ------------- 
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一 一 人 在 积极 开发 中 0 还 在 使 用 的 遗留 系统 





图 1-11 数据 库 技术 的 演变 

1.10.2 20 世 纪 70 年 代 

在 这 个 时 期 数据库 管理 系统 的 应 用 成 了 商业 现实 。 人 们 开发 出 大 量 层次 和 网 状 数据 库 管 
理 系统 以 应 对 日 益 复杂 的 数据 结构 ， 例 如 ， 生 产 中 用 到 的 材料 单 ， 它 用 普通 的 文件 处 理 方法 管 
理 是 极其 困难 的 。 层 次 和 网 状 模 型 通常 被 认为 是 第 一 代 DBMS。 两 种 方法 都 在 广泛 使 用 ， 事 实 
上 ,今天 还 继续 使 用 着 许多 这 样 的 系统 。 然 而 ， 它 们 存在 一 些 主要 缺点 : 

D 基于 导航 的 一 次 一 条 记录 的 过 程 使 得 数据 库 访问 十 分 困难 。 其 结果 是 ， 即 使 回答 简单 查 
询 ， 也 必须 编写 复杂 的 程序 。 

2) 数据 独立 性 非常 有 限 ， 因 此 ， 程 序 与 数据 的 改变 密切 相关 。 

3) 和 关系 数据 模型 不 同 ， 这 两 种 模型 都 没有 广泛 公认 的 理论 基础 。 
1.10.3 20 世 纪 80 年 代 

为 了 克服 这 些 局 限 ，E.F.Codd 和 其 他 人 在 20 世 纪 70 年 代 开发 了 关系 数据 模型 。 这 个 模型 被 
认为 是 第 2 代 DBMS 。20 世 纪 80 年 代 ， 它 在 商业 上 的 应 用 得 到 普遍 认可 并 广泛 使 用 。 在 关系 模 
型 中 ， 所 有 数据 都 以 表 的 形式 表示 。 比 较 简单 的 第 4 代 语 言 SQL 用 于 数据 查询 。 所 以 ， 关 系 模 
型 为 非 程序 员 提 供 了 方便 的 访问 方法 ， 克 服 了 第 一 代 系 统 的 主要 问题 。 








1.10.4 _ 20 世纪 90 年 代 

20 世 纪 90 年 代 的 这 十 年 迎 来 了 计算 的 新 纪元 ， 首 先是 出 现 了 客户 /服务 器 (Client/Server) 
计算 ， 然 后 数据 仓库 和 因特网 应 用 变 得 越 来 越 重要 。 虽 然 20 世 纪 80 年 代 DBMS 管 理 的 数据 大 部 
分 是 结构 化 的 (例如 财务 数据 )， 但 到 了 20 世 纪 90 年 代 多 媒体 数据 (包括 图 片 、 声 音 、 图 像 和 
视频 ) 变 得 越 来 越 普遍 。 为 了 处 理 这 些 日 益 复杂 的 数据 ， 在 20 世 纪 80 年 代 后 期 引入 了 面向 对 象 
数据 库 ( 称 为 第 3 代 ) (Grimes，1998 )。 第 14 章 和 第 15 章 将 详细 介绍 面向 对 象 数据 库 。 

由 于 组 织 必须 管理 大 量 结构 化 和 非 结 构 化 数据 , 关系 和 面向 对 象 数据 库 在 今天 都 非常 重要 。 
事实 上， 一 些 制造 商 正 在 开发 对 象 - 关 系 DBMS， 这 种 DBMS 能 够 管理 两 类 数据 。 附 录 D 将 介绍 
对 象 -~ 关系 数据 库 。 

1.10.5 2000 年 以 来 

我 们 自然 会 思索 : 未 来 十 年 ， 数 据 库 技 术 会 朝 着 什么 方向 发 展 ” 无 颖 将 会 对 现 许 多 在 我 们 
意料 之 外 的 重大 事件 ， 但 我 们 至 少 可 以 预见 到 以 下 这 些 必 然 的 趋势 : 

1) 管理 日 益 复杂 的 数据 类 型 的 能 力 。 这 些 类 型 包括 在 数据 仓库 应 用 中 已 经 .日 放量 要 的 多 纹 
数据 。 第 11 章 将 讨论 多 维 数据 。 

2) “通用 服务 器 ”的 继续 开发 。 基 于 对 象 - 关 系 DBMS ， 这 是 一 些 能 够 管理 各 种 对 用 户 透 
明 的 数据 类 型 的 数据 库 服 务 器 。 它 们 对 于 因特网 应 用 特别 重要 。 

3) 当 完 全 的 分 布 式 数据 库 成 为 现实 时 ， 数 据 库 集中 化 的 当前 趋势 将 继续 。 随 着 通信 成 本 随 
着 数据 量 增加 而 不 断 下 降 ， 查 找 和 访问 集中 化 数据 的 成 本 也 将 下 降 。 高 性 能 低 成 本 计算 也 促进 
了 集中 化 。 

4) 内 容 寻 址 存储 将 更 普遍 。 利 用 这 种 方法 ， 用 户 只 要 说 明 需 要 什么 数据 而 不 必 说 明 如 何 检 
索 就 能 够 找到 所 需 数据 。 例 如 ， 用 户 可 以 扫描 一- 张 照片 并 让 计算 机 查找 与 该 照片 最 接近 的 照片 。 

5) 数据 库 及 其 他 技术 (例如 ， 人 工 智能 和 类 似 电视 的 信息 服务 ) 使 得 数据 库 访问 对 于 未 经 
训练 的 用 户 来 说 更 加 容易 。 例 如 ， 用 户 将 能 够 以 更 自然 的 语言 请 求 数据 ， 数 据 库 技 术 将 根据 过 
去 的 查询 和 数据 库 的 改变 预料 用 户 对 数据 的 需要 。 

6) 开发 能 够 处 理 超大 数据 集 的 数据 挖掘 算法 能 够 使 组 织 有 效 地 分 析 他 们 巨大 的 数据 存储 。 
改善 关于 顾客 、 员 工 、 产 品 和 供应 商 的 识别 模式 、 趋 势 和 相互 关系 的 能 力 将 影响 他 们 对 战略 决 
策 的 制定 。 这 个 能 力也 应 用 于 从 Web 站 点 活动 中 获取 的 大 量 数据 。 例 如 ， 点 击 流 分 析 (Riggs， 
2000 )。 

7) 另 一 方面 ,个 人 数据 助理 (PDA) 的 激增 将 促进 小 型 数据 库 同步 的 改善 及 无 线 传输 率 的 
改善 。 蓝 牙 无 线 标准 将 大 大 加 速 连接 因特网 的 无 线 PDA 的 开发 。 这 个 发 展 将 强调 在 日 益 增 长 的 
无 线 世界 中 保护 数据 安全 的 重要 性 。 


本 章 小 结 


过 去 的 20 年 见证 了 数据 库 应 用 在 数量 和 重要 性 方面 的 巨大 增长 。 数 据 库 在 各 类 组 织 中 用 于 
存储 、 操 纵 和 检索 数据 。 在 2000 年 代 高 度 竞争 的 环境 中 ， 各 方面 数据 都 表明 数据 库 技 术 更 为 重 
要 。 现 代数 据 库 管理 是 信息 系统 学 科 中 最 重要 的 课程 之 一 。 

数据 库 是 相关 数据 的 有 组 织 的 集合 。 数 据 是 用 户 环境 中 有 意义 的 事实 或 对 象 。 术 语 有 组 织 
的 意思 是 数据 是 结构 化 的 ， 因 此 ， 用 户 很 容易 存储 、 管 理 和 检索 数据 。 术 语 相关 的 意思 是 数据 
描述 了 一 组 用 户 的 关注 领域 及 这 些 用 户 能 够 利用 这 些 数据 去 回答 有 关 该 领域 问题 。 信 息 是 这 样 
一 种 数据 ， 它 被 置 于 一 定 的 语 境 之 中 ， 并 能 以 便于 人 理解 的 合适 的 形式 处 理 和 表示 。 

元 数据 是 描述 其 他 数据 性 质 或 特征 的 数据 。 数 据 库 管理 系统 是 用 于 定义 、 建 立 、 维 护 和 提 
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供 对 数据 库 有 控制 访问 的 通用 商业 软件 系统 。DBMS 将 元 数据 存储 在 信息 库 中 ， 该 库 是 所 有 数 
据 定 义 、 数 据 联系 、 屏 幕 和 报表 格式 及 其 他 系统 组 成 部 分 的 中 央 仓 库 。 

计算 机 文件 处 理 系统 在 计算 机 早期 时 代 开发 ， 以 便 计 算 机 能 够 存储 、 管 理 和 检索 大 量 的 数 
据 文件 。 这 些 系统 《有 的 今天 还 在 使 用 ) 有 许多 严重 的 局 限 性 ， 例 如 ， 程 序 和 数据 间 的 依赖 性 、 
数据 重复 、 数 据 共 享有 限 和 开发 时 间 长 。 数 据 库 方法 能 够 克服 这 些 局 限 。 这 种 方法 强调 组 织 
数据 的 集成 和 共享 。 这 个 方法 的 优点 包括 程序 -数据 独立 性 、 改 善 数据 共享 、 最 小 数据 元 余 以 
及 提高 应 用 开发 的 生产 率 。 

数据 库 应 用 能 够 分 成 以 下 几 类 : 个 人 数据 库 、 工 作 组 数据 库 、 部 门 数据 库 、 企 业 数 据 库 和 
因特网 数据 库 。 当 今 的 企业 数据 库 包括 数据 仓库 和 内 容 取 自 不 同 运作 数据 库 的 集成 决策 支持 数 
据 库 。 企 业 资源 规划 (ERP) 系统 严重 依赖 于 企业 数据 库 。 

数据 库 技术 自 20 世 纪 60 年 代 问 世 以 来 稳步 发 展 。 驱 动 数据 库 发 展 的 主要 目标 包括 提供 更 高 
的 程序 -数据 独立 性 的 要 求 、 管 理 日 益 复杂 的 数据 结构 的 需要 和 为 所 有 用 户 提供 更 快 、 更 方便 
访问 的 要 求 。 月 前 ， 越 来 越 多 的 开始 人 们 使 用 能 满足 这 些 是 标的 面向 对 象 和 对 象 -关系 数据 库 。 


本 章 复习 

关键 术语 
约束 数据 库 管 理 系统 (DBMS ) 遗留 数据 
数据 企业 数据 模型 元 数据 
数据 独立 性 企业 资源 规划 (ERP) 系统 信息 库 
数据 仓库 外 部 网 用 户 视图 
数据 库 信息 
数据 库 应 用 内 部 网 

复习 问题 
1. 定义 下 列 术语 : 

a. 数据 b. 信 息 cc. 元 数据 ”dd. 数据库 应 用 


e. 数据 仓库 ”约束 8. 数据 库 ”hh. 遗留 数据 
2. 将 下 列 术语 和 定义 匹配 起 来 : 








_ ”数据 a. 放置 在 语 境 中 的 数据 或 概要 数据 

~ _ ”数据库 应 用 b. 应 用 程序 

约束 c. 事实 、 文 本 、 图 形 、 图 像 等 等 
信息 库 d. 集成 的 决策 支持 数据 库 

~ ”元 数据 e. 相关 数据 的 有 组 织 的 集合 

~ 数据 仓库 f. 包括 数据 定义 和 约束 
信息 g. 所 有 数据 定义 的 中 央 仓 储 

_ 用户 视 图 h. 数据 描述 和 程序 分 离 

-~ ”数据 独立 性 i. 不 能 违反 的 规则 

~ ”数据库 j. 部 分 数据 库 的 逻辑 描述 

3. 比较 下 列 术语 : 
a. 数据 依赖 ;数据 独立 性 b. 数据 仓库 ; 数据 挖掘 
c. 数据 ; 信息 d. 信息 库 ; 数据 库 


e. 实体 ; 企业 数据 模型 f. 数据 仓库 ERP 系 统 








4. 列 出 并 简要 描述 五 类 数据 库 ， 每 类 数据 库 给 出 -一 个 例子 。 

5. 数据 定义 为 什么 已 经 延伸 到 当今 的 环境 中 ? 

6. 列 出 数据 库 系 统 环境 的 9 个 主要 组 成 部 分 。 

7. 关系 数据 库 表 之 间 的 联系 如 何 表示 ? 

8. 对 于 下 列 各 类 数据 库 ， 列 出 每 类 数据 库 的 一些 通常 必须 回答 的 关键 问题 : 

个 人 数据 库 ; 工作 组 数据 库 ; 部 门 数据 库 ; ”企业 数据 库 ; 因特网 数据 库 

9. 术语 数据 独立 性 意味 着 什么 ， 为 什么 它 是 -- 个 重要 的 目标 ? 

10. 列 出 数据 库 方 法 和 文件 系统 相 比 的 六 个 六 在 优点 。 

11. 列 出 与 数据 库 方法 有 关 的 五 个 附加 成 本 或 风险 。 

12. 对 于 从 20 世 纪 60 年 代 至 20 世 纪 90 年 代 的 这 段 时 间 ， 列 出 每 十 年 的 主导 数据 库 技 术 。 指 
出 每 种 技术 属于 第 几 代 。 

13. 由 于 处 理 大 量 数据 能 力 的 改善 ， 描 述 有 效应 用 这 些 巨型 数据 库 的 三 个 业务 领域 。 
问题 和 练习 

1. 对 于 下 列 各 对 对 象 ， 指 出 它们 之 间 是 否 存在 一 对 多 或 多 对 多 联系 (在 典型 大 学 环境 下 )。 
然后 ， 用 教材 中 介绍 的 速记 符号 为 各 对 关系 画图 。 

a. STUDENT 和 COURSE (学 生 注 册 课 程 ) 
b. BOOK 和 BOOK COPY ( 书 有 多 个 副本 ) 
c. COURSE 和 SECTION (课程 有 多 个 班 ) 
d. SECTION 和 ROOM (各 班 被 安排 在 不 同 教室 ) 
e. INSTRUCTOR 和 COURSE 
.参照 图 1-4， 回 答 下列 问题 : 
a. 对 顾客 Customer_ ID 6， 有 哪些 订单 未 解决 (给 出 Order_ID 和 Order_Date ) 
b. 订单 Order_ID 2 包括 哪些 产品 ? (给 出 Product_ID 及 每 项 明细 的 Quantity ) 
c. 订 单 Order_ID 2 包括 哪些 产品 ? (给 出 Product_ID、 Product_Name 及 每 项 明细 的 
Unit_Price ) 

3. 为 了 与 顾客 联系 ， 检查 个 人 数据 库 (参见 图 1-7)。 CUSTOMER 和 CONTACT HISTORY 
之 间 的 联系 是 一 对 多 还 是 多 对 多 ? 用 教材 中 介绍 的 速记 符号 为 该 联系 画图 。 

4. 重读 本 章 描述 的 数据 和 数据 库 的 定义 。 近来 的 数据 库 管理 系统 才 包 含 存储 和 检索 数值 和 
文本 之 外 的 其 他 数据 的 能 力 。 图像、 声音 、 视频 和 其 他 高 级 数据 类 型 需要 什么 特殊 的 数据 存储 、 
检索 和 维护 能 力 ， 而 数值 和 文本 数据 不 需要 ? 

5. 表 1-1 为 一 组 数据 项 显示 了 元 数据 例子 。 为 这 些 数 据 中 再 安排 其 他 3 列 ( 即 为 已 列 出 的 属 
性 再 找 出 其 他 3 个 元 数据 特征 )， 并 且 在 表 1-1 中 为 这 3 列 补充 相应 的 项 。 

6. 在 1.3.2 节 中 ， 有 这 样 的 陈述 : 文件 处 理 系统 的 缺点 也 可 能 是 数据 库 的 局 限 ， 这 取决 于 组 
织 如 何 管理 数据 库 。 首 先 ， 组 织 为 什么 要 建立 多 个 数据 库 ， 而 不 是 一 个 支持 全 部 数据 处 理 需 求 
的 数据 库 ? 其 次 ， 什 么 组 织 和 个 人 因素 可 能 导致 组 织 具 有 多 个 、 独立 管理 的 数据 库 (因此 ， 不 
完全 遵循 数据 库 方法 ) ? 

7. 假设 有 一 个 学 生 俱乐部 或 组 织 ， 你 是 其 中 一 个 成 员 。 这 个 单位 的 数据 实体 有 了 哪些? 列 出 
并 定义 每 个 实体 。 然 后 ， 开发 一 个 企业 数据 模型 ( 如 图 1-3 所 示 )， 在 模型 中 显示 这 些 实体 及 其 
实体 问 重要 联系 。 

8. 在 1.5 节 中 ， 介 绍 了 5 类 不 同 的 数据 库 ， 并 为 每 类 数据 库 概述 了 一 系列 主要 决策 。 以 后 将 
了 解 如 何 处 理 这 些 和 其 他 决策 。 然 而 ， 在 阅读 完 本 章 后 ， 结合 你 对 计算 机 技术 的 全 面 认识 ， 你 


Ld 





条 1 童 数据 库 际 志 25 











应 该 能 够 预料 出 这 些 决策 在 实践 中 的 反应 。 对 于 以 下 几 类 数据 库 和 主要 决策 ， 解 释 你 认为 应 该 
作出 怎样 的 选择 或 在 任何 组 织 内 作出 选择 时 应 该 考虑 的 因素 。 

.个 人 数据 库 。 谁 负责 保证 个 人 数据 库 中 数据 的 准确 性 ? 

.工作 组 数据 库 。 在 工作 站 应 执行 哪些 数据 库 处 理 操作 服务 器 上 应 执行 哪些 数据 库 处 
理 操作 ? 

.部门 数 据 库 。 怎 样 才能 提供 足够 的 安全 性 以 防止 敏感 数据 未 经 授权 便 湾 露 或 扩散 出 
去 ? 

. 企业 数据 库 。 组 织 如 何 开 发 和 维护 关于 数据 命名 、 定 义 、 格 式 和 有 关 事 项 的 标准 ? 

. 因特网、 内 部 网 或 外 部 网 数据 库 。 借 助 服务 器 和 浏览 器 上 的 applets 和 代码 模块 ， 所 有 
组 成 部 分 怎样 才能 对 数据 意义 有 共同 理解 ? 

9. 构筑 电子 商务 .com 的 最 大 挑战 之 一 是 使 顾客 能 够 快速 收 人 到 从 WebiT 购 的 商品 。 从 本 章 学 
过 的 数据 库 知 识 和 在 Web 定 货 的 体验 出 发 ， 你 为 什么 认为 公司 应 利用 数据 库 解 决 方案 以 帮助 他 
们 改善 供应 链 管理 和 加 快 订 单 填写 和 发 送 ? 

应 用 练习 

1. 选择 一 个 具有 相当 密集 的 信息 系统 部 门 和 一 组 信息 系统 应 用 的 组 织 。 调 查 该 组 织 是 利用 
传统 文件 处 理 方法 还 是 数据 库 方法 去 组 织 数据 。 该 组 织 有 多 少 不 同 的 数据 库 ? 试 画 一 个 类 似 于 
图 1-2 的 图 ， 描 绘 该 组 织 的 部 分 或 所 有 文件 和 数据 库 。 

2. 对 于 应 用 练习 1 中 的 组 织 或 其 他 组 织 ， 向 数据 库 管理 员 或 设计 者 咨询 。 该 组 织 维护 哪 类 
数据 库 元 数据 ?” 组织 为 什么 选择 记录 这 些 元 数据 而 不 是 其 他 元 数据 ”它们 用 什么 工具 来 维护 元 
数据 ? 

3. 对 于 应 用 练习 1 或 ?中 的 组 织 或 其 他 组 织 ， 如 果 可 能 ， 确 定 组 织 中 的 数据 库 属 于 本 章 所 列 
5 类 数据 库 中 的 哪 一 类 : 个 人 、 荆 作 组 、 部 门 、 企 业 和 因特网 。 该 组 织 有 数据 仓库 吗 ? 如 果 有 ， 
该 数据 仓库 如 何 由 其 他 数据 库 的 数据 形成 ?该 组 织 使 用 ERP 系 统 吗 ? 

4. 对 于 以 上 提 到 的 组 织 ， 确 定 公司 使 用 的 是 内 部 网 、 外 部 网 或 支持 Web 的 业务 过 程 。 对 于 
每 一 种 方式 ， 人 确定 使 用 目标 和 连接 网 络 的 数据 库 管理 系统 。 询 问 公司 明年 在 他 们 的 业务 活动 中 
使 用 内 部 网 、 外 部 网 或 Web 的 计划 是 什么 。 为 了 实现 这 个 计划 ， 公 司 正在 寻求 的 新 技术 是 什么 。 

5. 在 你 学 习 本 书 时 ， 应 该 有 一 本 记录 自己 对 数据 库 管理 的 思想 和 观察 的 个 人 日 志 。 使 用 这 
本 日 志 记 录 你 听 到 的 评论 、 你 读 到 的 新 闻 故 事 概要 或 读 到 的 专业 文章 、 你 创造 的 原始 想法 或 假 
设 、 统 一 资源 定位 器 和 有 关 数 据 库 的 Web 站 点 的 评论 以 及 需要 进一步 分 析 的 问题 。 应 始终 关注 
涉及 数据 库 管理 的 任何 问题 。 为 了 提供 反馈 和 反应 ， 你 的 导师 会 定期 检查 你 的 日 志 。 该 日 志 是 
一 企 记 录 个 人 想法 的 无 结构 的 笔记 ， 它 将 补充 你 的 课堂 笔记 和 激发 你 思考 在 课堂 上 无 法 涉及 的 
课题 。 
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项 目 案例 : 山 景 社区 医院 


引言 

本 案例 提供 -- 个 应 用 每 章 所 学 概念 和 技术 的 机 会 。 我 们 选择 一 所 医院 作为 案例 ， 是 因为 医 
疗 组 织 在 当今 社会 举足轻重 ， 大 多 数 人 应 该 都 会 熟悉 它 。 本 书 每 一 章 的 末尾 均 包 含 本 案例 研究 
的 一 个 片段 。 每 个 片段 包括 与 该 章 内 容 有 关 的 案例 的 简要 描述 ， 随 后 是 问题 和 练习 。 

项 目 描述 

山 景 社区 医院 是 一 个 非 赢利 的 、 短 期 的 、 能 够 接待 急诊 的 医院 。 这 是 一 个 目前 有 150 个 床 
位 的 相对 较 小 的 医院 。 根 据 国家 趋势 ， 近 年 来 医疗 卫生 成 本 不 断 上 涨 ， 山 景 社区 医院 的 基本 目 
标 是 在 控制 成 本 的 情况 下 ， 为 周围 社区 提供 优质 的 医疗 服务 。 

山 景 社区 医院 具有 支持 下 列 领域 的 计算 机 应 用 : 病人 医疗 管理 、 临 床 服务 、 财 务 管理 和 管 
理性 服务 。 大 部 分 应 用 是 向 供应 商 买 来 的 ， 少 量 是 自行 开发 的 。 计 算 机 应 用 是 基于 C/S 技 术 ， 
如 图 1-5 所 示 。 大 部 分 计算 机 应 用 是 采用 关系 数据 库 技术 实现 的 。 大 部 分 数据 库 (及 应 用 ) 属 
于 本 章 介绍 的 部 门 数据 库 。 

山 景 社区 医院 的 关系 数据 库 包括 许多 表 。 图 1-12 显 示 了 其 中 的 两 个 表 ( 具有 一 些 样本 数据 )。 
PATIENT (病人 ) 表 包 含有 关 当 前 的 或 最 近 的 病人 数据 ， 而 PATIENT CHARGES (病人 费用 ) 
表 包 含 描述 病人 承担 费用 的 数据 。 在 本 章 ， 这 些 表 被 简化 了 ， 但 在 以 后 各 章 中 将 被 扩充 。 


PATIENT 





Patient Name Patient Number Patient Address 
Dimas, Salena 8379 617 Valley Vista 
Dolan, Mark 4238 818 River Run 
Larreau, Annette 3047 127 Sandhill 
Wiggins, Brian 5838 431 Walnut 
Thomas, Wendell 6143 928 Logan 











PATIENT CHARGES 





ltem Description item Code Patient Number Amount 
Room Semi-Priv 200 4238 1600 
Speech Therapy 350 3047 

Radiology 275 4238 

Physical Therapy 409 5838 

EKG Test 500 8379 


Room Semi-Priv 200 3047 
Es Ny 470 8379 





EEG Test 700 4238 








图 1-12 两 张 数 据 库 表 
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项 目 问 题 
1) 山 景 社区 医院 在 使 用 数据 库 时 应 该 希望 得 到 哪些 重要 好 处 ” 尽 可 能 多 地 叙述 你 对 医院 环 
竞 的 意见 。 


2) 使 用 数据 库 时 ， 医 院 必 须 小 心 管理 的 成 本 和 风险 是 什么 ? 

3) 当前 ， 山 景 社区 医院 正在 使 用 关系 数据 库 技 术 。 虽 然 这 个 技术 适合 结构 化 数据 (例如 ， 
病人 和 财务 数据 )， 但 它 对 于 复杂 数据 (如 地 理 数据 和 图 像 ) 不 太 适 合 。 你 能 够 考虑 --- 些 医院 维 
护 的 、 属 于 复杂 数据 的 数据 类 型 吗 ? 哪 一 类 数据 库 技 术 可 能 比 关系 技术 更 适合 这 些 数据 类 型 ? 

4) PATIENT 和 PATIENT CHARGES 两 表 中 的 数据 如 何 相关 ? 即 用 户 如 何 找到 某 一 个 病人 的 


有 关 费 用 ? 
5) 医院 使 用 因特网 的 途径 是 什么 ? 
项 目 练习 


1) 使 用 本 章 介 绍 的 速记 符号 ， 画 一 张 图 表示 PATIENT 和 PATIENT CHARGES 之 间 的 联系 。 

2) 为 PATIENT 和 PATIENT CHARGES 表 的 数据 属性 开发 一 个 元 数据 图 (参见 表 1-1)。 至 少 
使 用 表 1-1 中 的 那些 列 ， 但 可 以 包括 其 他 你 认为 适 于 山 景 社 区 医院 的 数据 管理 的 元 数据 特征 。 

3) 该 医院 的 重要 数据 库 视 图 之 一 是 病人 账单 。 以 下 是 这 个 视图 的 高 度 简 化 的 版 本 。 


Patient Name: Dolan, Mark 


Patient Number: 





Patient Address: 


ltem Code ltem Description Amount 








根据 图 1-12 中 的 数据 ， 为 上 述 视图 填写 缺少 的 数据 。 
4) 使 用 本 章 介绍 的 速记 符号 ， 画 一 张 图 表示 医院 环境 中 的 下 列 联系 。 
.HOSPITAL 的 工作 人 员 中 有 一 个 或 多 个 PHYSICIAN。 一 个 PHYSICIAN 只 能 是 一 个 


HOSPITAL 的 工作 人 员 。 
b. 一 个 PHYSICIAN 可 以 诊治 一 个 或 多 个 PATIENT 。 一 个 PATIENT 只 能 被 一 个 
PHYSICIAN 诊 治 。 


[e) 


.每 个 PATIENT 可 以 发 生 任 意 多 个 CHARGE。 一 个 特定 的 CHARGE 可 以 发 生 在 任意 多 
个 PATIENT 身上 。 
:一 个 HOSPITAL 有 一 个 或 多 个 WARD。 每 个 WARD 只 能 位 于 一 个 HOSPITAL 中 。 
一 个 WARD 有 一 个 或 多 个 EMPLOYEE。 一 个 EMPLOYEE 可 以 在 一 个 或 多 个 WARD 工 
作 。 

5) 根据 国家 趋势 ， 近 年 来 医疗 卫生 成 本 不 断 上 涨 ， 出 景 社 区 医院 的 基本 目标 是 在 控制 成 本 
的 情况 下 ， 为 周围 社区 提供 优质 医疗 服务 。 管理 良好 的 数据 库 如 何 帮 助 医院 实现 这 一 目标 ? 给 
出 一 些 使 用 医院 数据 库 改 善 医疗 服务 质量 和 控制 成 本 的 例子 。 


a. 





第 2 章 数据库 开发 过 程 


2.1 学 习 目 标 
学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 
。 定 义 下 列 关键 术语 : 企业 数据 模型 、 信 息 系统 体系 结构 (ISA)、 信 息 工程 、 自 项 向 下 规划 、 
业务 功能 、 功 能 分 解 、 系 统 开 发 生命 周期 (SDLC)、 原 型 法 、 计 算 机 辅助 软件 工程 (CASE)、 
信息 库 、 项 目 、 递 增 提 交 、 概 念 模 式 、 物 理 模式 以 及 客户 /服务 器 (C/S) 体 系 结构 。 
。 描 述 系统 开发 项 目的 生命 周期 ， 重 点 强调 数据 库 分 析 、 设 计 和 实现 活动 的 月 的 。 
*。 解释 数据 库 和 应 用 开发 的 原型 法 。 
。 解 释 设 计 、 实 现 、 使 用 和 管理 数据 库 的 人 员 的 角色 。 
。 解 释 概念 模式 、 外 部 模式 和 物理 模式 的 区 别 ， 以 及 数据 库 采 用 .三 层 借 式 体系 结构 的 原因 。 
* 解释 数据 库 的 二 层 定 位 体系 结构 和 数据 库 的 处 理 。 
。 解释 数 据 库 设计 和 开发 类 项 日 的 范围 。 
。 绘 制 显示 数据 库 范围 的 简单 数据 模型 。 


2.2 引言 
第 1 章 介绍 信息 系统 的 数据 库 方 法 和 许多 组 织 的 数据 库 应 用 环境 。 我 们 用 松 谷 家 具 公 司 的 
例 千 来 说 明 信 息 系统 中 数据 库 方法 的 许多 原则 和 概念 。 和 以 后 的 各 章 一 样 ， 在 这 -~ 章 ， 你 将 再 


-次 看 到 松 谷 家 具 公 司 作为 数据 库 管理 应 用 的 一 个 例子 。 

第 2 章 概 述 数 据 库 的 分 析 、 设 计 、 实 现 和 管理 的 主要 步骤 。 因 为 数据 库 是 信息 系统 的 一 部 
分 ， 所 以 在 本 章 你 将 看 到 数据 库 开发 过 程 怎样 适合 整个 信息 系统 的 开发 过 程 。 本 章 强调 数据 库 
开发 与 一 个 完整 的 信息 系统 的 其 他 部 分 的 开发 相 协 调 的 必要 性 。 本 章 包括 松 谷 家 上 有 具 公司 的 一 个 
假设 的 数据 库 开 发 过 程 的 重要 部 分 。 在 这 个 例子 中 ， 本 章 将 介绍 在 PC 机 上 开发 数据 库 的 工具 ， 
以 及 从 企业 数据 库 中 为 单独 应 用 提取 数据 的 步 又 。 

在 这 里 讨论 数据 库 开 发 有 以 下 几 个 原因 。 第 一 ， 尽 管 你 使 用 过 一 个 数据 库 管 理 系统 〈 例 如 
Microsoft Access) 的 基本 功能 ， 但 你 可 能 还 不 理解 数据 库 是 怎样 被 开发 的 。 本 书 主要 的 目标 
是 向 你 介绍 许多 设计 和 构建 数据 库 应 用 的 概念 和 工具 。 通 过 简单 的 例子 ， 本 章 将 简要 地 说 明 在 
利用 本 书 完成 一 门 数据 库 课程 之 后 你 可 以 作 些 什么 。 因 此 ， 本 章 将 为 在 以 后 各 章 中 详细 叙述 的 
十 题 奠定 基础 。 

第 -.， 许 多 学 生 利用 充满 具体 例子 的 教材 能 达到 最 好 的 学 习 效 果 。 尽 管 在 本 书 的 所 有 章节 
中 包含 大 量 的 例子 、 图 解 和 实际 的 数据 库 设 计 和 编码 ， 但 每 一 章 都 关注 于 数据 库 管理 的 一 个 特 
定 方面 。 本 章 的 主要 目的 是 帮助 你 理解 数据 库 管理 的 各 个 方面 是 如 何 相关 的 。 尽 管 我 们 尽量 减 
少 技术 细节 ， 但 是 我 们 希望 激发 你 学 习 后 续 各 章 中 详细 描述 的 数据 建 模 和 开发 技巧 的 兴趣 。 

最 后 ， 许 多 教师 希望 学 生 在 学 习 数据 库 课 程 之 初 就 能 尝试 简单 的 数据 库 开发 或 者 进行 一 个 
简单 的 课程 设计 。 由 于 本 书 中 的 各 个 主题 之 间 的 逻辑 顺序 ， 在 看 到 项 目的 目标 之 前 你 将 学 习 很 
多 内 容 。 本 章 将 指导 你 怎样 构建 -- 个 足以 开始 -个 课程 练习 的 数据 库 开发 项 目 。 很 明显 ， 由 于 
这 仅仅 是 第 2 章 ， 所 以 许多 例子 和 符号 将 比 你 在 其 他 课外 作业 中 的 项 目 或 一 个 实际 的 组 织 所 用 
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到 的 例子 和 符号 要 简单 得 多 。 

需要 指出 的 是 ， 你 不 可 能 仅仅 通过 本 章 的 学 习 就 学 会 如 何 设计 或 开发 数据 库 。 本 章 的 内 容 
是 简单 的 、 入 门 性 质 的 ， 其 中 所 用 的 许多 符号 与 你 将 华 后 续 章 节 中 学 到 的 符号 不 完全 一 样 。 在 
第 2 章 ， 我 们 的 目的 是 使 你 大 体 理 解 关 键 步骤 和 各 类 技巧 ， 而 不 是 学 会 特定 的 技术 。 然 而 ， 这 
将 培养 你 学 习 后 续 章 节 中 所 述 技巧 和 知识 的 学 习 的 热情 。 


2.3 信息 系统 开发 中 的 数据 库 开发 


在 许多 组 织 中 ， 数 据 库 开发 是 从 企业 数据 建 模 (enterprise data modeling) 开始 的 ， 企 业 数 
据 建 模 确定 了 组 织 数 据 库 的 范围 和 一 般 内 容 。 这 一 步骤 通常 发 生 在 一 个 组 织 进行 信息 系统 规划 
的 过 程 中 , 它 的 目的 是 为 组 织 数 据 创 建 一 个 整体 的 摘 述 或 解释 ,而 不 是 设计 一 个 特定 的 数据 库 。 
一 个 特定 的 数据 库 为 一 个 或 多 个 信息 系统 提供 数据 ， 而 企业 数据 模型 ( 可 能 包含 许多 数据 库 ) 
描述 了 由 组 织 维护 的 数据 的 范围 。 在 企业 数据 建 模 时 ， 你 审查 当前 的 系统 ， 分 析 需 要 支持 的 业 
务 领域 的 本 质 ， 描 述 需要 进一步 抽象 的 数据 ， 并 且 规 划一 个 或 多 个 数据 库 开发 项 目 。 图 2- 1 与 
图 1-3 完 全 相同 ， 它 使 用 第 3 章 和 第 4 章 中 所 使 用 的 符号 的 一 个 简化 版 本 显示 松 谷 家 具 公司 的 企 
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图 2-1 企业 数据 模型 的 一 部 分 ( 松 谷 家 具 公 司 ) 


2.3.1 信息 系统 体系 结构 

如 图 2-1 所 示 ， 高 级 的 数据 模型 仅仅 是 总 体 信息 系统 体系 结构 (Information System 
Architecture，ISA ) 的 一 部 分 或 一 个 组 织 信息 系统 的 蓝图 。 在 信息 系统 规划 期 间 ， 你 可 以 建立 
一 个 企业 数据 模型 作为 整个 信息 系统 体系 结构 的 一 部 分 。 根 据 Zachman(1987)、Sowa 和 
Zachman(1992) 的 观点 ， 一 个 信息 系统 体系 结构 由 以 下 6 个 关键 部 分 组 成 : 

1) 数据 (如 图 2-1 所 示 ， 但 是 也 有 其 他 的 表示 方法 ， 其 中 一 些 在 下 一 节 中 进行 描述 )。 

2) 操纵 数据 的 处 理 (这 些 可 以 用 数据 流 图 、 带 方法 的 对 象 模型 或 其 他 符号 表示 )。 

3) 网 络 ， 它 在 组 织 内 并 在 组 织 与 它 的 主要 业务 伙伴 之 间 传 输 数 据 ( 它 可 以 通过 网 络 连接 和 
拓扑 图 来 显示 )。 

4) 人 ， 人 执行 处 理 并 且 是 数据 和 信息 的 来 源 和 接收 者 ( 人 在 过 程 模 型 中 显示 为 数据 的 发 送 
者 和 接收 者 )。 

5) 执行 过 程 的 事件 和 时 间 点 (它们 可 以 用 状态 转换 图 和 其 他 的 方式 来 显示 )。 

6) 事件 的 原因 和 处 理 数据 的 规则 (经常 以 文本 形式 显示 ， 但 是 也 存在 一 些 用 于 规则 的 图 表 
工具 ， 如 决策 表 ) 。 
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2.3.2 信息 工程 

信息 系统 的 规划 者 按照 信息 系统 规划 的 特定 方法 开发 出 信息 系统 的 体系 结构 。 信 息 工 程 是 
一 种 正式 的 和 流行 的 方法 。 信 息 工 程 (information engineering) 是 一 种 面向 数据 的 创建 和 维护 
信息 系统 的 方法 。 因 为 信息 工程 是 面向 数据 的 ， 所 以 当 你 开始 理解 数据 库 是 怎样 被 标识 和 定义 
上 时， 信息 工 程 的 一 种 简洁 的 解释 是 非常 有 帮助 的 。 信 息 工 程 遵循 自 顶 向 下 规划 (top-down 
planning) 的 方法 ， 其 中 ， 特 定 的 信息 系统 从 对 信息 需求 的 广泛 理解 中 推导 出 来 〈( 例 如， 我 们 
需要 关于 顾客 、 产 品 、 供 应 商 、 销 售 员 和 加 工 中 心 的 数据 ) ， 而 不 是 合并 许多 详尽 的 信息 请 求 
(如 -- 个 订单 输入 屏幕 或 按照 地 域 报告 的 销售 汇总 )。 自 顶 向 下 规划 可 使 开发 人 员 更 全 面 地 规划 
信息 系统 ， 提 供 一 种 考虑 系统 组 件 集成 的 方法 ， 增 进 对 信息 系统 与 业务 目标 的 关系 的 理解 ， 加 
次 对 信息 系统 在 整个 组 织 中 的 影响 的 理解 。 

信息 工程 包括 四 个 步 又 : 规划 、 分 析 、 设 计 和 实现 。 信 息 工 程 的 规划 阶段 产生 信息 系统 体 
系 结构 ， 包 括 企业 数 据 模型 。 我 们 将 在 下 一 节 回 顾 信息 工程 的 规划 阶段 。 尽 管 本 书 在 本 质 上 并 
没有 遵循 信息 工程 的 方法 论 ， 但 是 余下 的 各 章 将 讨论 信息 工程 后 三 个 阶段 的 活动 。 
2.3.3 信息 系统 规划 

信息 系统 规划 的 目标 是 使 信息 技术 与 组 织 的 业务 策略 紧密 结合 ， 这 种 结合 对 于 从 信息 系统 
和 技术 的 投资 中 获取 最 大 利益 是 非常 重要 的 。 正 如 表 2-1 所 描述 的 那样 ， 信 息 工 程 方法 的 规划 
阶段 包括 3 个 步骤 ， 我 们 将 在 后 续 的 3 个 小 节 中 讨论 它们 。 

表 2-1 信息 工程 规划 阶段 


步 又 解 和 姑 
1 仿 定 关键 性 的 规划 因素 
a. 目标 
b. 关键 的 成 功 因 素 
c. 问题 领域 
2 依 定 组 织 的 规划 对 象 
a. 组织 单 元 
b. 地 点 
c. 业务 功能 
d. 实体 类 型 
3 建立 企业 模型 
a. 功能 分 解 
b. 实体 -联系 图 
c. 规划 年 阵 
一 一- 一 
1. 确定 关键 性 的 规划 因素 
关键 性 的 规划 因素 是 指 组 织 目标 、 关 键 的 成 功 因素 和 问题 领域 。 确 定 这 些 因素 的 目的 是 建 
并 规划 的 环境 并 且 将 信息 系统 规划 与 战略 业务 规划 联系 起 来 。 表 2-2 显 示 了 松 谷 家 具 公 司 的 一 
些 可 能 的 关键 规划 因素 ， 这 些 因素 有 助 于 信息 系统 的 管理 者 为 新 的 信息 系统 和 数据 库 设 定 优先 
级 以 处 理 需 求 。 例 如 ， 考 虑 到 不 精确 的 销售 预测 这 个 问题 领域 ， 信 息 系统 的 管理 者 可 能 在 组 织 
数据 库 中 存放 额外 的 历史 销售 数据 、 新 的 市 场 研究 数据 和 新 产品 的 测试 数据 。 
2. 确定 组 织 的 规划 对 象 
组 织 规 划 对 象 定义 了 业务 范围 ， 业 务 范围 会 限制 后 来 的 系统 分 析 和 信息 系统 可 能 发 生 改 变 
的 地 方 。 五 个 关键 的 规划 对 象 如 下 所 示 (参见 表 2-3 松 谷 家 具 公 司 的 关键 规划 对 象 的 例子 ): 
。 组 织 单元 ”组 织 中 的 各 种 部 门 。 
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。 组 织 地 点 ”业务 操作 的 发 生地 。 
。 业 务 功能 支持 组 织 使 命 的 业务 处 理 的 相关 组 。 业 务 功能 不 同 于 组 织 单元 ， 事 实 上 一 个 功 
能 可 以 分 配给 多 个 组 织 单元 (例如 ， 产 品 开发 功能 可 能 是 销售 部 和 生产 部 共同 的 责任 )。 
。 实 体 类 型 关于 组 织 所 管理 的 人 、 地 点 和 事物 的 数据 的 主要 类 别 。 
。 信 息 系 统 处 理 数据 集 的 应 用 软件 和 支持 程序 。 
表 2-2 信息 工程 规划 阶段 结果 的 例子 ( 松 谷 家 有 具 公司 ) 


规划 因素 例 了 
目标: 供 持 每 年 10 灾 的 增长 府 
保持 15 公 的 税 前 投资 冲 报 
避免 解雇 员工 
做 :个 负责 任 的 公司 成 员 
关键 成 功 因素 高 质 茹 的 产品 
及 时 发 送 成 由 
贡 工 的 识 生 产 兴 





问题 领域 不 准 从 的 销售 预测 
党 委 的 加 剧 


成 品 的 库存 不 足 





表 2-3 组 织 规划 对 象 的 例子 松 谷 家 具 公 司 ) 








规划 对 象 例 工 
组 织 音 元 销售 部 
i 订购 部 
财务 站 


生产 部 
加 王 部 
装配 部 
成 晤 部 
采购 部 
组 织 地 点 公司 总 部 
Durango 工 上 
西区 销售 处 
木材 [1 
业务 功能 业务 规划 
产 曲 开发 
原材料 管理 
市 场 和 销售 
履行 订单 
订单 发 货 
销售 汇总 
产品 操作 
财务 和 会 计 
实体 类 型 CUSTOMER 
PRODUCT 
RAW MATERIAL 
ORDER 
WORK CENTER 
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( 续 ) 


规划 对 家 例 子 
INVOICE 
EQUIPMENT 
EMPLOYEE 
信息 系统 事务 处 理 系统 
订单 跟踪 
订单 处 理 
[调度 
[ 资 单 
管理 信息 系统 
销售 管理 
库存 控制 
本 产 调度 








3. 建立 企业 模型 

-个 全 面 的 企业 模型 包括 每 个 业务 功能 的 功能 分 解 模型 、 企 业 数据 模型 和 各 种 规划 矩阵 。 
功能 分 解 (functional decomposition) 是 把 组 织 的 功能 进行 更 详细 分 解 的 过 程 ， 功 能 分 解 是 在 
系统 分 析 中 为 了 简化 问题 、 分 散 注意 力 和 确定 组 件 而 使 用 的 经 典 处 理 方法 。 在 松 谷 家 具 公 司 中 
让 单 异 行 功 能 的 功能 分 解 的 例子 如 图 2-2 所 示 。 对 于 处 理 业 务 功 能 和 支持 功能 (例如 表 2-3 中 列 
出 的 所 有 功能 和 子 功能 ) 的 全 部 集合 而 言 ， 多 个 数据 库 是 必须 的 ， 因 此 一 个 特定 的 数据 库 可 能 
仅 仪 对 支持 功能 (如 图 2-2 所 示 ) 的 一 个 子 集 提供 支持 。 为 了 减少 数据 元 余 和 使 数据 更 有 意义 ， 
拥有 完整 的 、 高 层次 的 企业 视图 是 非常 有 帮助 的 。 














L . 


了 
i “ Te 检查 产品 库存 ] :发 村 创建 备用 订单 


图 2-2 订单 懂行 功能 的 功能 分 解 过 程 的 例子 ( 松 谷 家 具 公 司 ) 


企业 数据 模型 使 用 特定 的 符号 来 描述 。 图 2-1 运 用 的 是 一 种 可 应 用 的 一 般 符号 ， 在 第 3 章 和 
第 4 章 中 将 解释 实体 -联系 图 这 种 更 流行 的 绘图 方法 。 除 了 实体 类 型 这 种 图 形 描述 外 ， 一 个 完 
整 的 企业 数据 模型 还 应 包括 每 个 实体 类 型 的 描述 和 描述 业务 操作 的 提要 ， 即 业务 规则 。 业 务 规 
则 决定 数据 的 有 效 性 ， 第 3 章 和 第 4 章 将 定义 和 说 明 业 务 规则 。 

一 个 企业 数据 模型 不 仅 包 括 实体 类 型 ， 还 包括 数据 实体 间 的 联系 ， 以 及 各 种 规划 对 象 间 的 
其 他 联系 。 显 示 规划 对 象 间 联 系 的 一 种 常见 形式 是 矩阵 。 由 于 规划 算 阵 不 需要 数据 库 被 明确 的 
建 模 就 可 以 明确 描述 业务 需求 ， 因 此 规划 和 矩阵 是 一 种 重要 的 功能 。 规 划 和 矩阵 经 常 从 业务 规则 中 
导出 ， 它 有 助 于 设 定 开发 活动 优先 级 、 将 开发 活动 排序 和 根据 自 顶 向 下 视图 通过 一 种 企业 范围 

















的 方法 安排 这 些 开 发 活动 。 有 许多 种 规划 矩阵 可 供 使 用 ， 它 们 的 共同 之 处 是 : 
“地 点 -功能 显示 业务 功能 在 哪个 业务 地 点 执行 。 
“单元 -功能 显示 业务 功能 由 哪个 业务 单元 执行 或 负责 。 
"信息 系统 -数据 实体 解释 每 个 信息 系统 如 何 与 每 个 数据 实体 相互 作用 【例如 ， 是 否 每 个 
系统 都 对 每 个 实体 中 的 数据 进行 创建 、 检 索 、 更 新 和 删除 )。 
“支持 功能 -数据 实体 确定 每 个 功能 中 数据 的 获取 、 使 用 、 更 新 和 删除 。 
“信息 系统 -目标 显示 信息 系统 支持 的 每 个 业务 目标 。 
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图 2-3 业务 功能 -数据 实体 矩阵 的 例子 

图 2-3 举 例 说 明了 一 个 可 能 的 功能 -数据 实体 气 阵 。 这 样 的 算 阵 可 以 用 于 多 种 目的 ， 包 括 以 
下 三 个 目的 : 

1) 确定 空白 实体 显示 哪些 数据 实体 没有 被 任何 功能 使 用 或 哪个 功能 没有 使 用 任何 实体 。 

2) 发 现 去 失 的 实体 每 个 功能 涉及 的 员工 通过 检查 矩阵 能 够 确认 任何 可 能 于 失 的 实体 。 

3) 区 分 开发 活动 的 优先 级 ”如 果 一 个 给 定 的 功能 对 于 系统 开发 有 高 优先 级 (可 能 因为 它 与 
重要 的 组 织 目 标 相 关 )， 那 么 这 个 领域 所 使 用 的 实体 在 数据 库 开发 中 拥有 高 优先 级 。 

Hoffer、George 和 Valacich(2002) 的 著作 中 有 关于 怎样 使 用 规划 和 矩阵 完成 信息 工程 和 系统 规 
划 的 更 完整 的 描述 。 


2.4 数据 库 开发 过 程 


基于 信息 工程 的 信息 系统 规划 是 数据 库 开发 项 目的 一 个 来 源 。 这 些 开发 新 数据 库 的 项 目 通 
常 是 为 了 满足 组 织 的 战略 需求 ， 例 如 改善 客户 支持 、 提 高 产品 和 库存 管理 或 进行 更 精确 的 销售 
预测 。 然 而 许多 数据 库 开发 项 目 更 多 的 是 以 自 底 向 上 的 方式 出 现 的 ， 例 如 信息 系统 的 用 户 需 要 
特定 的 信息 来 完成 他 们 的 工作 ， 从 而 请 求 开始 一 个 项 目 ， 又 如 其 他 信息 系统 的 专家 发 现 组 织 需 
要 改进 数据 管理 而 开始 新 的 项 目 。 即 使 在 自 底 向 上 的 情况 下 ， 建 立 企 业 数 据 模型 也 是 必须 的 ， 
以 便 理 解 现 有 的 数据 库 是 否 可 以 提供 所 需 的 数据 ， 否 则 ， 新 的 数据 库 、 数 据 实体 和 属性 都 应 访 
加 到 当前 的 组 织 数据 资源 中 去 。 


sy 
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2.4.1 系统 开发 生命 周期 

指导 管理 信息 系统 开发 项 目的 传统 过 程 是 系统 开发 生命 周期 (Systems Development Life 
Cycle，SDLC )。 系 统 开 发 生命 周期 是 指 一 个 组 织 中 由 数据 库 设计 人 员 和 程序 员 组 成 的 信息 系 
统 专家 小 组 详细 说 明 、 开 发 、 维 护 和 替换 信息 系统 的 全 部 步骤 。 这 个 过 程 常 被 看 作 一 组 瀑布 式 
的 步骤 ， 如 图 2-4 所 示 ( 见 Hoffer、George 和 Vaiacich，2002)。 将 这 个 过 程 比 作 瀑布 是 因为 每 一 
步 都 流 到 相 邻 的 下 一 步 ， 即 信息 系统 的 规格 说 明 是 一 块 一 块 地 开发 出 来 的 ， 每 一 块 的 输出 是 下 
一 块 的 输入 。 然 而 如 图 所 示 ， 这 些 步 又 并 不 是 纯 线性 的 ， 每 个 步骤 在 时 间 上 有 所 重合 (因此 可 
以 并 行 地 管理 步 又 )， 而 且 当 需要 重新 考虑 先前 的 决策 时 ， 还 可 以 回 滚 到 前 面 某 些 步 骤 。( 因而 
水 可 以 在 瀑布 中 倒流 ! ) 

网 2-4 对 系统 开发 生命 周期 每 一 阶段 的 目的 和 可 交付 的 产品 进行 了 简明 注解 。 系 统 开 发 生 
命 周期 的 每 一 阶段 都 包括 与 数据 库 开发 相关 的 活动 ， 所 以 ， 数 据 库 管理 的 问题 遍布 整个 系统 开 
发 过 程 。 我 们 在 图 2-5$ 中 重复 了 系统 开发 生命 周期 的 七 个 阶段 ， 并 概述 了 每 个 阶段 常见 的 数据 
库 开 发 活动 。 请 注意 , 系统 开发 生命 周期 的 阶段 和 数据 库 开 发 步骤 之 间 不 存在 一 一 对 应 的 关系 ， 
概念 数据 建 模 发 生 在 两 个 系统 开发 生命 周期 阶段 之 间 。 在 本 章 我 们 将 简要 地 说 明 松 谷 家 具 公 司 
的 数据 库 开发 步骤 的 每 一 步 。 


目的 为 找到 建立 新 的 或 增强 的 信息 系统 所 需 的 请 求 而 对 业务 环境 进行 初步 了 解 
可 交付 产品 一个 指导 项 目的 需求 ， 该 项 目 用 于 设计 和 下 发 解决 业务 问题 或 机 遇 的 信 
> ro 


人 目的 描述 业务 环境 和 信息 系统 怎样 帮助 解决 问题 或 提供 可 能 的 机 会 
项 目 开始 > - 份 天 十 研究 改变 现 有 系统 或 开发 新 系统 可 行 性 的 书面 请 求 
和 规划 
分 析 业 务 环 境 以 确定 全 部 需求 、 组 织 这 些 沉 求 并 选择 有 竞争 力 的 
未 统 和 在 
多 满足 用 户 需求 且 可 以 开发 和 实现 的 系统 功能 规格 说 明 
i 目的 导出 所 有 的 信息 需求 并 将 其 结构 化 
逻辑 设计 可 交付 产品 关于 数据 、 表 单 、 报 表 、 显 示 和 处 理 规 则 的 详细 功 
> 能 规格 说 明 









目的 详 述 所 有 的 技术 和 组 织 规格 说 明 
可 交付 产品 程序 和 数据 库 结构 、 技 术 购 决 、 物 理 站 点 规划 
和 组 织 的 重 设计 


目的 。 写 程 序 、 建 立 数据 文件 、 测 试 和 安装 新 系统 、 
培训 用 户 和 完成 文档 

可 交付 产品 “正确 运行 的 程序 、 规 格 说 骨 、 文 档 和 培 
训 材料 

目 稀 ”监控 系统 的 运转 和 使 用 情况 ， 修 补 和 增强 系 
统 

可 交付 产品 ”对 系统 的 定期 审计 以 说 明 系 统 是 否 仍 
能 精确 地 满足 需求 


图 2-4 系统 开发 生命 周期 (SDLC ) 













企业 建 模 
项 月 论证 和 .分析 当 前 的 数据 处 理 
选择 .分 析 总 的 业务 功能 和 它们 的 数据 库 需求 
.还 明 能 够 支撑 业务 的 新 数据 和 数据 库 的 需求 
概念 数据 建 模 
项 日 开 始 和 .为 信息 系统 确定 数据 库 的 需求 范围 


， 为 数据 库 支 持 的 业务 功能 分 析 全 部 数据 天 求 
* 开发 包括 实体 各 联系 的 初步 的 概念 数据 模型 
。 比 较 初 步 的 概念 数据 模型 和 企业 数据 模型 


人 人， 联系 、 忆 性 和 业务 规则 的 详细 的 概念 数据 模型 
分 析 ot 
用人 金 部 数据 库 规 格 说 明 填充 信息 
逻辑 数据 库 设 计 


* 证 细 分 析 震 昌 数 据 库 云 持 的 业务 功能 中 的 事务 、 才 单 、 最 于 和 在 询 
i (数据 库 视图 ) 
忆 镍 设 i > oe 


规划 





* 人 确定 数据 的 完整 性 和 安全 需求 让 填 充 信 息 库 
* 为 数据 库 建立 稳定 的 和 明和 位 定义 的 结构 
人 物理 数据 库 的 设计 和 定义 
物理 设计 “对 数据 库 答 理 系统 (DBMS 、 通 常 从 信息 库 牛 成 ) 定 义 数 据 库 
* 决 定数 据 的 物理 组 织 
* 设 计数 据 库 处 理 程序 
数据 库 实现 
* 编 克 和 测试 数据 库 处 理 程序 
“完成 数据 库 文档 和 培训 材料 
“安装 数据 库 并 转换 以 前 系统 的 数 氛 


6 数据 库 维 护 
维护 * 分 析 数 据 库 和 数据 库 应 用 程序 以 依 保 它们 清 足 不 断交 
化 的 信息 需求 
“调整 数据 库 以 改进 性 能 


“修补 数据 库 和 数据 库 应 几 程 序 中 的 错误 并 恢复 受 损害 
的 数据 库 


图 2-5 系统 开发 生命 周期 中 的 数据 库 开发 活动 





1. 企业 建 模 

数据 库 开 发 过 程 从 企业 建 模 (系统 开发 生命 周期 中 项 目 论证 和 选择 阶段 的 -部 分 ) 开始， 
设 定 组 织 数 据 库 的 范围 和 一 般 内 容 。 企 业 建 模 发 生 在 信息 系统 规划 和 其 他 活动 期 间 ， 这 些 活动 
确定 信息 系统 的 哪个 部 分 需要 改变 和 加 强 并 概述 出 爹 部 组 织 数据 的 范围 。 存 这 -一步 中 ， 检查 当 
前 数据 库 和 信息 系统 ， 分 析 作 为 开发 项 目 主体 的 业务 领域 的 本 质 ， 用 非常 一 般 的 术语 描述 每 个 
信息 系统 在 开发 时 所 需要 的 数据 。 每 个 项 目 只 “有 当 它 达到 组 织 的 预期 目标 时 才 可 以 进行 下 一 - 步 。 

2. 概念 数据 建 模 

对 一 个 已 经 开始 的 信息 系统 项 目 而 言 ， 概 念 数据 建 模 阶段 分 析 信息 系统 的 全 部 数据 需求 。 
它 分 为 两 个 阶段 。 首 先 ， 在 项 目 开始 和 规划 阶段 建立 一 张 类 似 于 图 2-1 的 图 ， 同时 建立 其 他 文 
档 米 概述 不 考虑 现存 数据 库 的 情况 下 特定 开发 项 目 中 所 需 的 数据 范围 。 此 时 仅 仪 包括 高 层 类 别 
的 数据 (实体) 和 主要 联系 。 然后 在 系统 开发 生命 周期 的 分 析 阶 段 产 生 确 定 信息 系统 必须 管理 
的 全 部 组 织 数据 的 详细 数据 模型 ， 定 义 所 有 数据 属性 ， 列 出 全 部 数据 类 别 ， 表示 数据 实体 间 所 
有 的 业务 联系 ， 确 定 描述 数据 完整 性 的 全 部 规则 。 在 分 析 阶 段 ， 还 要 检查 概念 数据 模型 (在 本 
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章 后 面 也 称 作 概念 模式 ) 与 用 来 解释 目标 信息 系统 其 他 方面 的 模型 类 别 的 一 致 性 ， 例 如 处 理 步 
又 、 处 理 数据 的 规则 以 及 事件 的 时 序 。 然 而 ， 即 使 是 这 样 详细 的 概念 数据 模型 也 只 是 初步 的 ， 
内 为 后 续 的 信息 系统 生命 周期 中 的 活动 化 设计 事务 、 报 表 、 显 示 和 查询 时 可 能 会 发 现 遗 漏 的 元 
素 或 错误 。 办 此 ， 经 常 说 钙 的 概念 数据 建 模 是 以 一 种 白 顶 向 下 的 方式 完成 的 ， 它 由 业务 领域 的 
一 般 理 解 所 驱动 ， 而 不 是 由 特定 的 信息 处 理 活动 所 驱动 。 

3. 逻辑 数据 库 设 计 

逻辑 数据 库 设 计 从 两 个 角度 进行 数据 库 开 发 。 首 先 ， 将 概念 数据 模型 变换 成 基于 关系 数据 
库 理 论 的 标准 表示 方法 一 一 关系 ， 在 第 5 章 你 将 学 会 怎样 完成 这 个 重要 的 过 程 。 然 后 像 设 计 信 
息 系统 的 每 个 计算 机 程序 (包括 程序 的 输入 和 输出 格式 ) 那样 ， 对 数据 库 支持 的 事务 、 报 表 、 
显示 和 查询 进行 详细 的 检查 。 在 这 个 所 谓 的 自 底 向 上 的 分 析 中 ， 精 确 地 验证 数据 库 中 需要 维护 
的 数据 和 在 每 个 上 事务、 报表 等 等 中 需要 的 奢 些 数据 的 性 质 。 

对 于 每 个 单独 的 报表 、 事 务 等 等 的 分 析 都 要 考虑 一 个 特定 的 、 有 限制 的 但 是 完全 的 数据 库 
视图 。 当 报表 、 事 务 等 被 分 析 时 有 可 能 根据 需要 而 改变 概念 数据 模型 。 尤 其 在 大 型 的 项 目 中 ， 
不 则 的 分 析 人 员 和 系统 开发 者 的 团队 可 以 独立 地 工作 在 不 同 的 程序 或 程序 集中 ， 他 们 所 有 工作 
的 细 三 直到 逻辑 设计 阶段 才 可 能 会 显示 出 来 。 在 这 种 情况 下 ， 次 辑 数 据 库 设 计 阶 段 必 须 将 原始 
的 概念 数据 模型 和 这 些 独立 的 用 户 视图 合并 或 集成 到 一 个 全 面 的 设计 中 。 在 进行 逻辑 信息 系统 
设计 时 也 可 以 确定 额外 的 信息 处 理 需求 ， 此 时 这 些 新 的 需求 必须 集成 到 前 面 确定 的 逻辑 数据 库 
设计 中 。 

逻辑 数据 库 设计 的 最 后 一 步 是 根据 为 生成 结构 良好 的 数据 规格 说 明 而 确定 的 规则 ， 将 组 合 
的 、 协 商 后 的 数据 规格 说 明 转换 成 基本 的 或 原子 的 元 素 。 对 当今 的 大 部 分 数据 库 而 言 ， 这 些 规 
则 来 自 关系 数据 库 理论 和 称 作 规范 化 的 过 程 ， 我 们 将 在 第 5 章 详细 讲述 这 一 过 程 。 这 一 步 的 结 
果 是 产生 管理 这 些 数据 的 、 不 引用 任何 数据 库 管理 系统 的 完整 的 数据 库 描述 图 。 在 完成 逻辑 数 
据 库 设计 后 ， 开 始 确定 详细 的 计算 机 程序 的 逻辑 和 维护 、 报 告 数据 库 内 容 所 需 的 查询 。 

4. 物理 数据 库 设 计 和 定义 

物理 数据 库 设 计 和 定义 阶段 决定 计算 机 存储 器 (通常 是 磁盘 ) 中 数据 库 的 组 织 ， 定 义 数据 
库 管理 系统 的 物理 结构 ， 概 述 处 理事 务 的 程序 ， 产 后 期 望 的 管理 信息 和 决策 支持 的 报表 。 本 阶 
段 的 月 标 是 设计 能 够 有 效 、 安 全 地 管理 所 有 数据 处 理 的 数据 库 ， 因 此 物理 数据 库 设计 需 紧密 结 
合 物理 信息 系统 其 他 方面 的 设计 ， 包 括 程序 、 计 算 机 硬件 、 操 作 系 统 和 数据 通信 网 络 。 

5. 数据 库 实 现 

数据 库 实现 阶段 编写 、 测 试 和 安装 处 理 数据 库 的 程序 。 设 计 人 员 可 以 使 用 标准 的 编程 语言 
(如 COBOL、C 或 Visual Basic)、 专 用 的 数据 库 处 理 语言 (如 SQL )， 或 专用 的 非 过 程 化 语言 
编程 ， 以 产生 固定 格式 的 报表 、 显 示 结 果 ， 可 能 还 包括 图 表 。 在 实现 阶段 ， 还 要 完成 所 有 的 数 
据 库 文档 ， 培 训 用 户 ， 为 信息 系统 (和 数据 库 ) 的 用 户 安装 程序 。 最 后 一 步 是 利用 现存 的 信息 
源 (遗留 应 用 中 的 文件 和 数据 库 以 及 现在 需要 的 新 数据 ) 加 载 数据 。 加 载 数据 的 第 一 步 经 常 是 
将 数据 从 现存 的 文件 和 数据 库 中 转 到 一 种 中 间 的 格式 (如 二 进 制 或 文本 文件 )， 然 后 再 将 这 些 
中 间 数 据 加 载 到 新 的 数据 库 中 。 最 后 ， 运 行 数 据 库 以 及 相关 的 应 用 以 供 实际 的 用 户 维护 和 检索 
数据 。 在 运转 期 间 ， 定 期 备份 数据 库 ， 并 当 数 据 库 损坏 或 受到 影响 时 恢复 数据 库 。 

6. 数据 库 维 护 

数据 库 在 数据 库 维护 期 间 逐 浙 发 展 。 在 这 一 步 ， 为 了 满足 变化 的 业务 条 件 ， 为 了 改正 数据 
库 设计 的 错误 ， 或 数据 库 应 用 的 处 理 速度 而 增加 、 删 除 或 改变 数据 库 的 结构 特征 。 当 一 个 程序 
或 计算 机 发 生 故 障 而 使 数据 库 受到 影响 或 损坏 时 也 可 能 应 该 重建 数据 库 。 这 一 步 通 常 是 数据 库 
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开发 过 程 中 最 长 的 一 步 ， 因 为 它 持续 数据 库 及 其 相关 应 用 的 整个 生命 周期 ， 每 次 数据 库 的 发 展 
都 可 看 作 一 个 简略 的 数据 库 开 发 过 程 ， 其 中 会 出 现 概念 数据 建 模 、 逻 辑 和 物理 数据 库 设计 以 及 
数据 库 实现 以 处 理 提出 的 变化 。 
2.4.2 信息 系统 开发 的 其 他 方法 

系统 开发 生命 周期 法 或 其 稍 作 变 化 的 变 体 经 常用 于 指导 信息 系统 和 数据 库 的 开发 。 信 息 系 
统 生 命 周 期 (SDLC ) 是 一 种 方法 学 ， 它 是 高 度 结构 化 的 方法 ， 它 包括 许多 检查 和 权衡 以 确保 
每 一 步 产 生 精 确 的 结果 ， 而 且 新 的 或 替代 的 信息 系统 与 它 必 须 通信 的 或 数据 定义 需要 一 致 的 现 
存 系统 保持 一 致 。 系统 开发 生命 周期 法 经 常 由 于 产生 一 个 工作 系统 需要 很 长 的 时 间 而 受到 批评 ， 
因为 工作 系统 仅仅 在 整个 过 程 结 束 时 才 产 生 。 现 在 组 织 越 来 越 多 的 使 用 快速 应 用 开发 法 
(RAD)， 它 是 一 个 包含 分 析 、 设 计 和 实现 步骤 的 快速 重复 的 迭代 过 程 ， 直 到 汇聚 到 用 户 所 需 的 
系统 为 止 。 快 速 应 用 开发 法 在 所 需 的 数据 库 已 经 存在 、 增 强 系统 主要 是 为 了 检索 数据 的 应 用 中 
适用 ， 而 不 适用 于 那些 生成 和 修改 数据 库 的 应 用 。 

使 用 最 广泛 的 快速 应 用 开发 法 之 一 是 原型 法 (prototyping )。 原 型 靶 是 一 个 系统 开发 的 先 
代 过 程 ， 通 过 分 析 员 和 用 户 的 紧密 配合 ， 持 续 地 修改 系统 而 最 终 将 所 有 需求 转换 成 一 个 工作 系 
统 。 图 2-6 显 示 原 型 法 的 过 程 。 在 此 图 中 我 们 包含 了 注释 ， 概 略 地 描述 了 每 个 原型 法 阶段 的 数 
据 库 开 发 活动 。 一 般 来 说 ， 当 信息 系统 的 问题 被 确定 时 ， 仅 仅 粗略 地 尝试 概念 数据 建 模 。 在 开 
发 最 初 的 原型 时 ， 设 计 用 户 想 要 的 显示 和 报表 ， 同 时 理解 任何 新 的 数据 库 需 求 并 定义 一 个 用 于 
原型 的 数据 库 。 这 通常 是 一 个 新 的 数据 库 ， 它 复制 现存 系统 的 一 部 分 ， 还 可 能 增加 了 一 些 新 的 
内 容 。 当 需要 新 的 内 容 时 ， 这 些 内 容 通常 来 自 外 部 数据 源 ， 如 市 场 研 究 数据 、 一 般 的 经 济 指标 
或 行业 标准 。 
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图 2-6 原型 法 和 数据 库 开 发 过 程 


当 产生 原型 新 的 版 本 时 重复 数据 库 的 实现 和 维护 活动 。 通 常 仅 进行 最 低 限 度 的 安全 性 和 完 
整 性 控制 ， 因 为 此 时 的 重点 是 尽 可 能 快 地 产生 可 以 使 用 的 原型 版 本 。 而 且 文 档 管理 也 延迟 到 项 
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目的 最 后 ， 在 交付 使 用 时 才 进 行 用 户 培训 。 最 后 ， 一 旦 构建 了 一 个 可 接受 的 原型 ， 开 发 者 和 用 
户 将 决定 最 后 的 原型 和 数据 库 是 否 能 交付 使 用 。 如 果 系 统 (包括 数据 库 ) 效率 很 低 ， 那 么 系统 
和 数据 库 将 被 重新 编程 和 重新 组 织 以 达到 期 望 的 性 能 。 

随 着 可 视 化 编程 工具 (如 Visual Basic、Java、Visual C++ 和 第 四 代 语 言 ) 越 来 越 流行 ， 利 
用 可 视 化 编程 工具 可 以 很 方便 地 修改 用 户 与 系统 间 的 界面 ， 原 型 法 正成 为 可 供 选 择 的 系统 开发 
方法 。 使 用 原型 法 改变 用 户 报表 和 显示 的 内 容 和 布局 是 相当 容易 的 。 在 这 个 过 程 中 ， 新 的 数据 
库 需 求 被 确定 ， 因 此 被 发 展 中 的 应 用 使 用 的 现存 的 数据 库 应 该 进行 修改 。 基 至 有 可 能 为 一 个 需 
要 新 的 数据 库 的 系统 使 用 原型 法 ， 在 这 种 情况 上 下， 当 系 统 需求 在 选 代 的 开发 过 程 中 不 断 变化 时 
需要 获取 样本 数据 以 建造 或 重建 数据 库 原 型 。 

2.4.3 计算 机 辅助 软件 工程 的 作用 和 信息 库 

在 前 面 章节 中 ， 我 们 提 到 过 CASE 工 具 在 信息 系统 开发 中 的 作用 。 计 算 机 辅助 软件 工程 
(Computer-Aided Software Engineering，CASE) 工具 是 为 系统 开发 过 程 的 某 些 部 分 提供 自动 
支持 的 软件 。 我 们 的 目的 是 学 习 数据 库 开 发 ，CASE 工 具有 三 个 相关 的 特征 。 第 一 是 它 有 能 力 
帮助 我 们 使 用 实体 -联系 图 或 其 他 的 符号 (参见 图 2-1 所 示 的 E-R 符 号 一 种 形式 的 例子 ) 绘制 数 
据 模型 。CASE 工 具 绘 图 的 能 力 是 “数据 库 智 能 的 "， 其 中 每 个 符号 表示 特定 的 数据 模型 结构 ， 
这 些 符号 仅仅 能 够 按照 与 相关 结构 的 属性 相 一 致 的 方式 使 用 。 数 据 库 绘 图 工具 可 用 于 企业 建 
模 、 概 念 数据 建 模 、 远 辑 数据 库 设 计 和 物理 数据 建 模 。CASE 工 具 能 帮助 我 们 确保 图 与 图 之 间 
的 一 致 性 。 例 如 ，CASE 工 具 可 以 确保 每 个 PRODUCT 实 体 在 任何 图 中 使 用 时 含义 一 致 。 
CASE 绘 图 工具 强制 使 每 个 数据 对 象 有 惟一 的 名 字 ， 当 数据 对 象 的 特征 发 生 改 变 时 可 以 自动 重 
画 数 据 模型 。 

通常 ， 不 同 的 绘图 工具 和 相关 的 方法 用 于 数据 库 开发 过 程 的 不 同 阶段 。 例 如 ， 一 个 工具 用 
于 在 企业 建 模 时 绘制 高 层 图 和 年 阵 ， 另 一 个 工具 可 能 用 于 概念 数据 建 模 ， 其 他 的 某 个 工具 用 于 
逻辑 数据 库 设计 等 等 。 

CASE 工 具 第 二 个 重要 的 特性 是 它 可 以 产生 代码 。 通 常 ， 这 些 代码 包含 一 个 给 定数 据 库 管 
理 系 统 的 数据 库 定义 命令 。 在 数据 库 实现 阶段 ，CASE 工 具 将 查阅 所 有 的 概念 、 逻 辑 和 物理 数 
据 规 格 说 明 并 生成 创建 关系 表 、 定 义 每 张 表 的 每 个 属性 和 关键 索引 的 SQL 命 令 。 某 些 CASE 工 
具 还 能 够 生成 C 语 言 或 其 他 语言 的 代码 作为 数据 库 检 索 和 更 新 程序 的 基础 代码 (虽然 这 是 
CASE 工 具 不 常用 的 功能 )。 

有 了 绘图 工具 后 ， 许 多 组 织 为 了 生成 代码 及 绘图 而 使 用 单独 的 工具 。 如 果 这 些 工具 和 方法 
很 有 效率 , 则 必须 集成 它们 。 特别 是 这 些 工 具 必 须 能 够 共享 开发 过 程 的 每 个 阶段 产生 的 元 数据 。 
但 是 ， 共 享 这 些 信息 的 CASE 工 具 还 不 常见 ， 尤 其 是 不 同 的 供应 商 所 提供 的 工具 。 所 谓 的 集成 
的 CASE (1-CASE) 工具 在 整个 生命 周期 中 提供 支持 ， 但 是 这 样 的 工具 使 用 得 相当 少 ， 因为 它 
们 对 系统 开发 过 程 的 某 个 特定 阶段 的 支持 能 力 很 强 ， 而 在 其 他 阶段 支持 能 力 却 很 弱 。 支持 系统 
开发 生命 周期 从 项 目 认 证 和 选择 阶段 到 物理 设计 阶段 的 工具 被 称 作 上 层 CASE 工 具 : 支持 实现 
和 维护 阶段 的 工具 被 称 作 底 层 CASE 工 具 。 

工具 集成 取决 于 一 个 用 来 构建 和 维护 信息 系统 的 正式 的 、 详 细 的 体系 结构 。 这 个 体系 结 
构 包 括 工具 间接 口 的 正式 定义 、 工具 间 的 数据 模型 标准 和 贯穿 整个 生命 周期 的 常见 控制 。 这 
使 得 CASE 工 具 的 第 三 个 特征 一 一 信息 知识 库 (或 信息 库 ) 对 于 我 们 讨论 数据 库 开 发 过 程 很 重 
要 。 信 息 库 (repository ) 存储 企业 必须 能 够 访问 的 事实 和 企业 必须 成 功 执行 的 过 程 的 事实 信 
息 的 知识 库 (Moriarty，1991)。 因 此 ， 例 如 在 音 息 库 中 要 维护 数据 库 开发 的 六 个 阶段 中 收集 
的 所 有 信息 。 从 某 种 意义 上 说 ， 信 息 库 本 身 也 是 一 个 数据 库 ， 它 包 括 产 牛 所 有 图 、 表 单 、 报 
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表 定 义 和 其 他 系统 文档 所 需 的 信息 。 信 息 库 帮助 系统 和 数据 库 分 析 员 实现 多 个 CASE 工 具 间 数 
据 的 无 颖 集成 。 


2.5 数据 库 开发 中 的 人 员 管 理 


如 图 2-5 所 暗示 的 那样 ， 数 据 库 开发 是 项 目的 --- 部 分 。 项 目 (project) 是 为 了 达到 一 个 目标 
(县 有 开始 和 结尾 ) 而 计划 采取 的 相关 活动 。 项 目 从 项 目 认 证 和 规划 的 第 一 步 开 始 ， 到 实现 阶 
段 的 最 后 一 步 结束 。 一 个 高 级 的 系统 或 数据 库 分 析 员 将 作为 项 目 主管 。 此 人 负责 创建 详细 的 项 
日 计划 、 安 置 人 员 和 监督 项 目 团队 。 一 个 好 的 项 日 主管 应 具有 领导 能 力 、 管 理 能 力 、 能 很 好 地 
处 理 与 客户 的 关系 和 交流 、 解 决 技术 问题 的 能 力 、 冲 突 管理 能 力 、 团 队 建 设 能 力 和 管理 风险 与 
变化 的 能 力 。 

项 目 在 项 目 认证 和 规划 阶段 启动 并 进行 规划 ， 在 分 析 、 逻 辑 设计 、 物 理 设计 和 实现 阶段 执 
行 ， 在 实现 阶段 结束 时 结束 。 项 目 团队 在 项 目 开 始 时 组 建 ， 一 个 系统 或 数据 库 开发 团队 应 该 包 
括 以 下 人 员 : 

* 系统 分 析 员 分 析 业 务 环 境 ， 确 定 信息 需求 和 信息 服务 以 解决 业务 问题 或 抓 住 业务 机 遇 。 

“数据 库 分 析 员 专门 负责 决定 信息 系统 数据 库 组 件 的 需求 和 设计 。 

“ 用户 ”提供 他 们 对 信息 需求 的 评估 并 监督 开发 系统 是 否 满足 他 们 的 需求 。 

* 程序 员 设计 和 编写 计算 机 程序 ， 这 些 程序 包括 维护 和 访问 数据 库 中 的 数据 的 命令 。 

“数据 库 管 理 员 和 数据 管理 员 ”负责 现存 的 和 将 来 的 数据 库 ， 确 保 数据 库 间 的 一 致 性 和 完 

整 性 ， 且 作为 数据 库 技术 的 专家 为 其 他 项 目 组 成 员 提供 咨询 和 培训 。 

“其 他 技术 专家 例如 网 络 专家 、 操 作 系 统 专家 、 测 试 专 家 和 文档 专家 。 

项 目 主管 的 责任 是 选择 和 管理 上 述 这 些 人 以 组 成 一 个 有 效率 的 团队 。 关 于 怎样 管理 一 个 系 
统 开 发 项 目 团队 ， 详 见 Hoffer、George 和 Valacich (2002) 的 著作 。 

项 目 结束 分 为 自然 结束 和 非 自然 结束 。 非 自然 结束 的 原因 有 系统 不 再 有 商业 价值 、 系 统 的 
性 能 或 开发 团队 不 能 被 接受 、 项 目 耗 尽 了 时 间 和 资金 却 仍 未 完成 或 难以 支持 等 等 。 为 了 确定 项 
目 进展 是 否 符合 计划 并 且 未 超过 预算 ,项 目 主管 应 该 建立 项 目 活 动 的 详细 时 间 表 ， 通 常 这 种 时 
间 表 用 图 的 形式 描述 ， 如 图 2-7 所 示 的 例子 图 表 。 这 些 图 表 显示 项 目 活动 开始 和 结束 的 时 间 、 
谁 负责 完成 这 些 话 动 、 每 个 活动 需要 多 少 努力 才能 完成 ， 以 及 活动 间 的 前 后 顺序 ( 即 一 个 活动 
依赖 于 哪 一 个 活动 的 输出 )。 

成 功 的 系统 开发 项 目的 一 个 特征 是 有 频繁 的 检查 点 ， 项 目 组 成 员 在 检查 点 报告 到 此 为 止 时 
项 目的 结果 。 通 常 ， 这 些 结果 要 报告 给 项 目 组 以 外 的 人 ,包括 其 他 用 户 、 为 项 目 提供 资金 的 人 、 
高 级 信息 系统 管理 人 员 ， 还 可 能 包括 管理 人 员 。 要 频繁 设立 检查 点 的 原因 如 下 : 

“ 验证 项 目的 进度 是 否 邻 人 满意 。 

“根据 每 日 活动 的 详细 记录 回 滚 到 上 一 步 并 验证 项 目的 所 有 部 分 是 否 可 以 合 到 一 起 。 

“获取 项 目 各 方 的 新 的 投入 (对 持续 数 月 的 项 目 来 说 尤其 重要 )。 

注意 ， 第 三 个 原因 涉及 到 增 量 投入 的 概念 。 增 量 投入 (incremental commitment) 是 系统 
开发 项 目 中 的 一 种 策略 ， 它 在 每 个 阶段 后 进行 检查 ， 在 每 次 检查 后 调整 项 目的 后 续 部 分 。 增 量 
投入 允许 那些 对 项 目 感 兴趣 的 人 仅仅 承诺 对 项 目的 下 一 个 阶段 进行 投入 〈 只 需 有 限 的 时 间 和 成 
本 )， 在 一 些 结果 显示 出 来 后 重新 评估 是 否 要 对 资源 (人 和 金钱 ) 进一步 的 投入 。 因 此 ， 当 系 
统 最 初 的 概念 被 证 实 不 再 有 价值 时 ， 也 不 会 再 浪费 重要 的 资源 。 增 量 投入 使 一 个 项 目 可 以 很 容 
易 地 改变 方向 或 中 止 。 
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b) PERT 图 
图 2-7 描述 项 目 计 划 的 图 表 


2.6 数据 库 开 发 的 三 层 模式 体系 结构 


在 本 章 前 面 关于 数据 库 开发 过 程 的 解释 中 提 到 了 在 一 个 系统 开发 项 目 上 建立 的 几 个 不 同 
的 、 但 是 相关 的 数据 库 视图 或 模型 : 











。 概念 模式 (在 分 析 阶 段 建立 )。 

。 外 部 模式 或 用 户 视图 〈 在 分 析 阶 段 和 逻辑 设计 阶段 建立 )。 

*。 物理 模式 或 内 部 模式 (在 物理 设计 阶段 建立 )。 

图 2-8 摘 述 了 数据 库 这 三 个 视图 之 间 的 关系 ， 重 要 的 是 要 记 住 ， 它 们 是 同一 个 组 织 数据 库 
的 视图 或 模型 。 也 就 是 说 ， 每 一 个 组 织 数据 库 都 有 一 个 物理 模式 、 一 个 概念 模式 以 及 一 个 或 多 
个 用 户 视图 。 因 此 ， 三 层 模 式 体系 结构 用 观察 间 --- 数 据 集 的 不 同方 式 定义 数据 库 。 

概念 模式 (conceptual schema) 关于 全 部 数据 库 结 构 的 、 与 技术 无 关 的 规格 说 明 。 概 念 模 
式 定义 了 整个 数据 库 而 不 涉及 数据 怎样 存储 在 计算 机 的 二 级 存储 器 中 。 通 常 ， 概 念 模式 用 实 
体 - 联 系 (E-R) 图 或 对 象 建 模 符 号 这 样 的 图 形 格式 来 描述 ， 我 们 把 这 种 类 型 的 概念 模式 称 为 
数据 模型 。 另 外 ， 概 念 模式 的 规格 说 明 作为 元 数据 存储 在 信息 库 或 数据 字典 中 。 

在 第 1 章 中 ， 用 户 视图 被 描述 为 用 户 执行 某 个 任务 所 需 的 部 分 数据 库 的 逻辑 描述 。 因 此 ， 
用 户 视 图 (或 外 部 模式 ) 也 是 独立 于 数据 库 技术 的 ， 但 是 它 通 常 包 括 与 特定 的 用 户 或 用 户 组 
(如 一 个 库存 经 理 或 应 收 款 部 门 ) 相关 的 概念 模式 的 一 个 子 集 。 因 为 一 个 程序 被 特定 的 用 户 或 
用 户 组 使 用 ， 所以， 用户 视 图 也 是 用 于 一 个 特定 程序 (例如 订单 录入 程序 ) 的 模式 的 一 个 版 本 。 
内 此 ， 可 以 用 多 辑 (独立 于 技术 ) 术语 和 编程 语言 术语 ( 与 编程 语言 语法 一 致 ) 定义 用 户 视图 。 
通常 ， 用 户 视图 的 最 初 描述 是 计算 机 屏幕 显示 、 业 务 事务 (如 签署 更 新 表单 ) 和 报表 ， 因 为 它 
们 通常 描述 一 个 处 理 显示 、 事 务 和 报表 的 程序 所 需 的 所 有 数据 。 用 户 视图 的 一 个 逻辑 版 本 可 以 
表示 成 E-R 图 、 对 象 图 或 关系 。 第 5 章 中 描述 将 E-R 图 翻译 成 关系 ， 然 后 将 所 有 关系 合并 为 一 个 
数据 库 完整 关系 的 描述 的 过 程 。 


一 个 组 织 数据 库 描述 
程序 报表 定义 


程序 事务 定义 





用 户 视图 
(报表 ) 


用 户 视图 2 用 户 视图 n 


(屏幕 显示 ) 多 (事务 ) 


概念 模式 


图 2-8 三 层 模式 数据 库 体 系 结构 


物理 模式 (physical schema) 包括 概念 模式 的 数据 怎样 存储 在 计算 机 的 二 级 存储 器 中 的 规 
格 说 明 。 对 数据 库 分 析 员 和 设计 人 员 来 说 ， 重 要 的 是 物理 数据 库 (物理 模式 ) 的 定义 ， 它 提供 
了 关于 分 配 和 管理 存储 和 访问 的 数据 所 在 的 物理 二 级 存储 器 空间 的 数据 库 技术 的 全 部 规格 说 明 。 

数据 库 开发 和 数据 库 技术 是 以 数据 库 这 三 个 模式 间 的 区 分 为 基础 的 。 数 据 库 开 发 项 目的 一 
个 角色 可 能 仅 需 处 理 与 这 三 个 视图 中 的 一 个 相关 的 工作 。 例 如 ， 一 个 初学 者 可 能 设计 用 于 一 个 
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或 多 个 程序 的 外 部 模式 ， 而 -- 个 有 经 验 的 开发 者 将 设计 物理 模式 或 概念 模式 。 数 据 库 设计 问题 
在 不 同 的 层次 上 有 很 大 的 不 同 。 为 此 ， 本 书 的 组 织 关注 于 设计 数据 库 这 _: 种 表示 的 问题 : 

。 概念 模式 “第 3 章 和 第 4 章 讨论 实体 -联系 建 模 ， 第 14 章 讨论 面向 对 象 建 异 。 这 是 描述 概念 

模式 或 数据 模型 的 两 种 不 同 图 形 符 号 。 

“外 部 模式 ”第 5 章 讨论 关系 数据 库 、 规 范 化 、 将 E-R 图 转换 成 关系 以 及 合并 关系 集 ， 所 有 

这 些 主题 有 助 于 外 部 模式 的 开发 和 分 析 。 

。 物理 模式 “第 6 章 讨论 在 设计 一 个 物理 数据 库 时 必须 作出 的 决定 ， 第 7 章 和 第 8 章 讨 论 怎样 

用 一 种 定义 物理 模式 和 数据 库 的 语言 一 -SQL 来 详细 说 明 这 些 决定 。 第 15 章 讨论 面向 对 

象 数据 库 的 设计 ， 附 录 D 讨 论 混 合 的 、 对 象 -关系 数据 库 的 设计 。 

概念 模式 、 外 部 模式 和 物理 模式 合 在 一 起 构成 了 数据 库 的 三 层 模式 体系 结构 。 注 意 ， 即 合 
图 2-8 中 显示 外 部 模式 在 最 顶端 ， 外 部 模式 也 并 不 是 必须 在 概念 模式 之 前 开发 。 事 实 上 ， 技 术 
人 员 通 常会 选 代 地 开发 概念 模式 和 外 部 模式 (参见 图 2-9)。 通 常 ， 第 一 级 的 概念 模式 的 开发 是 
基于 对 组 织 的 企业 数据 模型 和 对 项 目 数据 库 需求 的 一 般 理解 。 然 后 开发 用 于 每 个 事务 、 报 表 ， 
屏幕 显示 和 其 他 系统 用 途 的 外 部 模式 (用户 视 图 )。 在 大 多 数 情况 下 ， 对 外 部 模式 的 分 析 将 产 
生 概 念 模式 中 没有 显示 的 新 的 属性 和 可 能 的 实体 及 联系 。 所 以 ， 概 念 模式 随 着 这 些 由 所 谓 的 自 
底 向 上 的 源 确定 的 需求 而 增加 ,从 而 使 得 概念 模式 和 外 部 模式 一致 。 当 新 的 用 户 视图 被 确定 时 ， 
概念 模式 和 外 部 模式 的 发 展 将 重复 以 上 过 程 。 . 

为 了 开始 开发 一 个 数据 库 以 及 与 它 关联 的 应 用 程序 , 需要 编写 相关 的 物理 模式 的 规格 说 明 。 
在 设计 具有 相关 的 物理 模式 的 物理 数据 库 时 ， 除 了 概念 模式 和 外 部 模式 以 外 ， 还 需 考虑 硬件 和 
软件 特征 ， 以 及 用 户 对 数据 库 性 能 的 期 望 。 在 设计 物理 数据 库 时 ， 将 可 能 遇 到 不 一 致 性 或 概念 
模式 或 用 户 视图 的 其 他 问题 ， 所 以 ， 循 环 回 到 这 些 设计 步骤 是 可 能 的 〈 在 图 2-9 中 没有 显示 )。 
以 后 ， 当 其 他 的 用 户 需求 确定 下 来 后 ， 这 个 过 程 重新 开始 。 通 常 新 的 需求 是 批量 处 理 的 ， 并 且 
在 新 的 外 部 模式 和 概念 模式 设计 的 循环 中 一 起 考虑 ， 所 以 ， 数 据 库 不 是 经 常 地 改变 。 周 期 性 地 
修正 数据 库 发 生 在 系统 开发 的 维护 阶段 。 

概念 模式 理解 事务 、 报 表 、 


.WW .， 屏幕 显示 和 数据 库 
企业 数据 模型 用 途 
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开发 用 户 视图 (外 
部 模式 ) 和 逻辑 数 
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用 户 视图 
. 当 概念 数据 库 和 外 部 数 
念 模式 "! 视 
概念 模式 六 用 户 视图 


开发 物理 模式 


硬件 和 软件 特性 ， 
数据 的 物理 特征 mm 让 wos 性 能 期 间 


图 2-9 开发 一 个 数据 库 项 目 王 层 模式 体系 结构 的 过 程 












2.7 三 层 数 据 库 定位 体系 结构 


显然 ， 所 有 数据 库 中 的 好 的 事情 部 和 “_ ”有关 

当 设 计 一 个 数据 库 时 , 你 要 选择 把 数据 存放 在 何 处 。 这 个 选择 在 物理 数据 库 设计 阶段 作出 。 
我 们 将 在 第 6 章 中 考虑 一 个 更 广 范 围 的 物理 数据 库 设计 决策 ， 但 是 在 这 一 节 我 们 想 概 述 能 够 影 
响 数 据 库 开发 过 程 的 主要 的 数据 库 体 系 结构 的 选择 。 

在 第 1 章 中 已 经 介绍 过 ， 数 据 库 分 为 个 人 数据 库 、 工 作 组 数据 库 、 部 门 数据 库 、 企 业 数 据 
库 和 因特网 数据 库 。 个 人 数据 库 经 常 由 最 终 用 户 自己 设计 和 开发 ， 仅 仅 由 数据 库 专 家 给 予 培训 
和 咨询 帮助 ， 它 仅 包含 最 终 用 户 个 人 感 兴趣 的 数据 。 有 了 时候 ， 个 人 数据 库 是 从 工作 组 数据 库 或 
企业 数据 库 中 提取 出 来 的 ， 这 种 情况 下 数据 库 专 家 经 常 编写 一 些 提取 例 程 来 创建 本 地 数据 库 。 
[ 作 组 数据 库 和 部 门 数 据 库 经 常 被 最 终 用 户 、 业 务 部 门 中 的 系统 专家 和 中 心 数 据 库 专家 一 起 开 
发 。 这 些 人 员 的 协同 工作 是 必须 的 ， 因 为 在 设计 共享 的 数据 库 时 必须 权衡 大 量 的 问题 ， 处 理 速 
度 、 吻 于 使 用 、 数 据 定义 的 差别 和 其 他 类 似 的 问题 。 由 于 企业 数据 库 和 因特网 数据 库 影响 广 、 
规模 大 ， 所 以 ， 通 常 由 在 集中 的 数据 库 开 发 小 组 中 受过 专业 培训 的 数据 库 专家 来 开发 。 

这 种 数据 库 定位 的 视图 对 许多 现代 组 织 进 行 了 一 定 的 简化 ， 它 瞳 示 一 个 数据 库 被 严格 地 定 
位 在 这 四 个 层次 之 一 。 事 实 上 ， 为 了 平衡 各 种 组 织 因素 和 技术 因素 ， 一 个 给 定 的 信息 系统 的 数 
据 可 能 分 布 在 多 个 计算 机 的 位 置 或 层次 中 。 而 且 ， 为 了 利用 处 理 速度 、 易 于 使 用 或 易于 在 不 同 
的 平台 上 编程 ， 一 个 数据 库 数 据 的 不 同类 型 的 处 理 可 以 发 生 在 不 同 的 地 点 。 在 公司 数据 库 中 广 
泛 使 用 基于 浏览 器 接口 导致 了 应 用 服务 器 市 场 的 增长 ， 应 用 服务 器 处 理 Web 浏 览 器 和 后 端 数据 
库 乙 间 的 业务 软件 和 事务 。 大 部 分 应 用 服务 器 的 供应 商 ， 包 括 Sun、IBM 和 Oracle 已 经 采用 了 
Java 2 企业 版 (J2EE) 作 为 它们 应 用 服务 器 的 标准 。 可 以 考虑 四 层 结构 ， 其 中 包括 客户 服务 器 、 
应 用 服务 器 、Web 服 务 器 和 数据 库 服务 器 ， 但 通常 考虑 的 是 三 层 结构 。 

1. 客户 层 

一 个 台式 计算 机 或 笔记 本 也 称 作 表 示 层 ， 它 专门 管理 用 户 系 统 界面 和 本 地 化 数据 ， 在 这 一 
层 上 可 以 执行 Web 脚 本 任务 。 

2. 应 用 服务 器 /Web 服 务 器 层 

处 理 HTTP 协 议 、 脚 本 任务 ， 执 行 计 算 和 提供 数据 访问 ， 所 以 该 层 称 作 处 理 服务 层 。 

3. 企 业 服务 器 〈( 小 型 机 或 大 型 机 ) 层 

执行 复杂 的 计算 和 管理 来 自 组 织 间 多 个 数据 源 的 数据 的 合并 ， 也 称 作 数据 服务 层 . 

这 三 层 体系 结构 在 图 2-10 中 描述 。 一 个 客户 /服务 器 体系 结构 的 有 限 视图 仅仅 考虑 客户 层 和 
一 个 一 般 的 服务 器 层 。 

在 一 个 组 织 中 ， 数 据 库 和 信息 系统 分 层 的 体系 结构 与 用 于 分 布 式 计算 的 客户 /服务 器 体系 
结构 的 概念 相关 。 客 户 /服务 器 体系 结构 (clientserver architecture) 基于 一 个 局 域 网 环境 ， 其 
中 服务 器 上 ( 称 作 数据 库 服务 器 或 数据 库 引擎 ) 的 数据 库 软 件 执行 来 自 客户 工作 站 的 数据 库 命 
令 ， 每 个 客户 的 应 用 程序 专注 于 它们 的 用 户 接口 功能 。 实 际 上 ， 整 个 概念 数据 库 (以 及 访问 这 
些 数据 库 的 应 用 处 理 例 程 ) 作为 一 个 分 布 式 数据 库 或 单独 但 是 相关 的 物理 数据 库 而 分 布 在 本 地 
的 PC 工作 站 、 中 间 的 服务 器 (工作 组 或 部 门 ) 和 一 个 中 心服 务 器 (部门 或 企业 ) 上 。Hoffer、 
George 和 Valacich (2002) 以 及 Thompson (1997) 的 著作 中 概述 了 为 什么 这 种 体系 结构 越 来 越 
流行 。 简 单 地 说 ， 使 用 客户 /服务 器 体系 结构 的 原因 是 

“ 它 可 以 在 多 个 处 理 器 上 同时 处 理 同一 个 应 用 ， 因 此 改善 了 应 用 的 响应 时 间 和 数据 处 理 

速度 。 
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* 它 可 以 利用 每 个 计算 机 平台 最 好 的 数据 处 理 特性 (如 PC 的 高 级 用 户 界面 与 小 型 机 和 大 型 
机 的 计算 速度 ) 。 
“可 以 混合 使 用 各 种 客户 端的 技术 (装配 Inte1 或 Motorola 处 理 器 的 个 人 计算 机 、 网 络 计算 
机 、 信 息 站 等 ) 和 共享 公共 数据 。 另 外 ， 你 可 以 在 任何 层 改变 技术 而 仅 对 其 他 层 系统 模 
块 的 影响 很 小 。 
* 能 够 使 处 理 靠 近 需 处 理 的 数据 源 ， 从 而 改进 响应 时 间 并 减少 网 络 通信 量 
。 它 允许 和 鼓励 接受 开放 系统 标准 。 

应 付 账 处 理 现金 流 分 析 客户 服务 代表 
潮 览 移 
供应 商 、 购 买 订 
单 、 供 应 商 发 票 
的 数据 库 














浏览 网 
= I 
给 供应 商 付款 的 


浏览 网 
客户 层 





没有 本 地 
数据 库 


应 用 /Web 服 务 器 
A/P、A/R、 订 单 处 理 、 库 存 控制 ， 





应 用 /Web 层 等 等 ; 访问 和 连接 DBMS; 动态 
Web 页 面 ; 会 话 管理 
包括 所 有 组 织 数据 或 不 同 部 门 服 务 
器 数据 的 汇总 的 事务 数据 库 
企业 层 


带 有 DBMS 的 企业 服务 器 
图 2-10 三 层 客 户 /服务 器 数据 库 体 系 结构 


对 数据 库 开 发 而 言 ， 使 用 一 个 多 层 的 客户 /服务 器 体系 结构 开发 数据 库 最 有 意义 之 处 在 于 ， 
易于 将 数据 库 开发 和 维护 数据 库 的 模块 与 向 最 终 用 户 表 示 数 据 库 内 容 的 信息 系统 模块 分 隔 开 。 
表示 例 程 能 够 使 用 像 PowerBuilder、Java 和 Visual Basic 这 样 的 语言 来 提供 易于 使 用 的 图 形 化 的 
用 户 界面 。 通 过 中 间 件 (参见 第 9 章 )， 表 示例 程 能 够 通过 层 间 相互 作用 来 访问 例 程 ， 该 例 程 访 
问 所 需 数据 并 分 析 这 些 数据 以 形成 所 需 信 息 。 作 为 一 个 数据 库 开发 人 员 和 程序 员 ， 你 可 以 在 这 
三 层 中 的 任何 一 层 工 作 ， 开 发 必需 的 软件 。 

我 们 将 在 第 9 章 中 更 详细 地 讨论 客户 /服务 器 体系 结构 ， 在 该 章 将 略 述 怎样 决定 在 计算 机 网 
络 的 多 个 层 中 如 何 分 布 数据 。 


2.8 为 松 谷 家 具 公司 开发 一 个 数据 库 应 用 


在 第 1 章 中 介绍 了 松 谷 家 具 公司 。 这 个 公司 自 1990 年 以 来 一 直 使 用 关系 数据 库 管理 技术 ， 
在 个 人 计算 机 、 部 门 小 型 机 和 公司 服务 器 上 具有 大 量 的 数据 库 (参见 图 1-6 松 谷 家 具 公司 的 计 
算 机 网 络 的 总 图 示 )。 








Helen Jarvis 是 松 谷 家 具 公 司 的 家 庭 办 公 室 家 具 的 产品 经 理 ， 她 知道 这 个 正在 成 长 的 产品 系 
列 的 竞争 越 来 越 沿 烈 。 因 此 对 松 谷 家 有 具 公司 而 言 ，Helen 能 够 更 透彻 地 分 析 产 品 的 销售 变 得 越 
来 越 重要 。 这 些 分 析 常 常 是 即席 的 ， 会 被 迅速 变化 和 无 法 预期 的 业务 环境 、 家 上 有 具 商场 经 理 的 评 
论 、 贸 易 行 业 的 观点 或 经 验 所 驱动 。Helen 忆 经 请 求 利 用 易 用 的 界面 直接 访问 销售 数据 ， 这 样 
她 能 够 为 各 种 营销 问题 寻找 答案 。 

Chris Martin 是 松 谷 家 有 具 公司 信息 系统 开发 领域 的 系统 分 析 员 。Chris 已 经 在 松 谷 家 具 公 司 
工作 了 5 年 ， 在 松 谷 家 具 公 司 的 -- 些 业务 领域 具有 丰富 的 信息 系统 方面 的 经 验 。 由 于 他 曾经 从 
事 过 几 个 系统 开发 项 有 目 ， 在 西 佛罗里达 大 学 接受 过 信息 系统 教育 并 在 松 谷 家 有 具 公 司 接受 过 全 面 
培训 ， 所 以 Chris 成 长 为 公司 最 好 的 系统 开发 人 员 之 一 。Chris 擅 长 数据 建 模 ， 他 熟悉 公司 内 使 
用 的 几 个 关系 数据 库 管 理 系 统 。 鉴 于 他 的 经 验 、 技 能 和 他 有 空闲 时 间 ， 所 以 信息 系统 的 主管 分 
配 Chris 与 Helen 一 起 工作 来 解决 Helen 对 营销 支持 系统 的 需求 。 

央 为 松 谷 家 具 公 司 在 系统 的 开发 中 采取 谨慎 的 态度 ， 尤 其 因为 采用 了 数据 库 方 法 ， 所 以 公 
司 已 经 拥有 一个 相当 完全 的 信息 系统 体系 结构 ， 包 括 所 有 运作 的 业务 功能 的 数据 库 。 因 此 ， 
Chris 可 以 从 现存 的 数据 库 中 提取 Helen 所 需 的 数据 。 当 Helen 请 求 建立 单机 的 数据 库 时 ， 松 谷 家 
具 公 司 信息 系统 体系 结构 要 求 这 样 的 系统 ， 所 以 ， 对 数据 的 没有 结构 的 和 无 法 预见 的 使 用 将 不 
会 干涉 访问 需要 支持 有 效 的 事务 处 理 的 运行 数据 库 。 

再 则 ， 因 为 Helen 的 需求 是 数据 分 析 而 不 是 创建 和 维护 ， 而 且 是 个 人 的 需求 ， 不 是 机 构 的 
需求 ， 所 以 ，Chris 决 定 采用 -- 种 原型 法 和 生命 周期 法 的 结合 的 方法 来 开发 Helen 所 请 求 的 系统 。 
采用 结合 的 方法 意味 着 Chris 将 按照 生命 周期 的 步 又 ， 但 是 以 一 种 快速 的 、 粗 略 的 方式 进行 这 
些 步 又 ， 而 不 是 完整 地 采用 原型 法 。 因 此 ， 他 将 迅速 地 启动 项 目 和 进行 规划 (包括 确定 这 个 系 
统 在 公司 的 信息 系统 体系 结构 中 的 位 置 )， 然 后 与 Helen 紧 密 的 合作 ， 不 断 地 分 析 、 设 计 和 实现 
以 建立 一 个 Helen 需 要 的 系统 原型 。 因 为 这 个 系统 是 个 人 的 ， 而 且 仅 需要 一 个 有 限 范 围 的 数据 
库 ， 所 以 ，Chris 希 望 原型 最 终 成 为 Helen 可 以 实际 使 用 的 系统 。Chris 选 择 用 Microsoft Access 来 ， 
开发 系统 ，Access 是 松 谷 家 具 公 司 在 开发 个 人 数据 库 时 经 常 使 用 的 技术 。 然 而 ， 在 多 数 情况 下 ， 
应 该 说 明定 义 数据 库 结构 所 必须 的 SQL， 因 为 这 些 命令 能 用 于 定义 任何 一 个 采用 关系 数据 库 管 
理 的 数据 库 。 

2.8.1 匹配 用 户 需求 和 信息 系统 体系 结构 

Chris 开 始 开 发 家 庭 办 公 室 家 具 的 数据 库 和 相关 的 营销 支持 系统 的 项 目 时 初次 会 见 了 Helen 
Chris 问 Heien 关 于 她 的 业务 领域 ， 记 录 了 业务 领域 目标 、 业 务 功能 、 数 据 实体 类 型 和 其 他 她 要 
处 理 的 业务 对 象 。 此 时 ，Chris 听 多 于 说 ， 以 便 专注 于 理解 Helen 的 业务 领域 ， 他 不 时 地 插入 问 
题 以 确保 Helen 不 会 遗漏 任何 她 需要 信息 系统 提供 的 计算 机 屏幕 显示 或 报表 。Chris 问 的 是 非 党 
一 般 的 问题 ， 尽 可 能 地 使 用 业务 或 营销 术语 。 例 如 ，Chris 问 Helen 她 在 管理 家 庭 办 公 室 产 品 时 
面临 哪些 问题 , 什么 人 、 什 么 地 点 和 事物 是 她 在 工作 中 感 兴趣 的 ， 她 需要 分 析 多 久 以 前 的 数据 ， 
以 及 在 业务 中 什么 事件 发 生 时 她 将 感 兴趣 。 

表 2-4 总 结 了 Chris 从 初次 会 见 中 了 解 到 的 内 容 。 这 张 表 列 出 了 Helen 提 到 的 各 种 业务 对 
象 ， 并 且 这 些 对 象 已 经 在 公司 的 信息 系统 体系 结构 中 了 。 图 中 仅 有 少量 的 实体 不 在 信息 系 
统 体系 结构 中 ， 然 而 体系 结构 覆盖 Helen 提 到 的 数据 的 主要 种 类 ， 现 有 的 信息 系统 管理 着 这 
些 数据 。 因 此 ，Chris 相 信 ， 即 使 不 是 全 部 数据 ， 大 部 分 Helen 想 要 的 数据 已 经 存在 十 公司 的 
数据 库 中 。 
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表 2-4 产品 行销 支持 系统 的 业务 对 象 ， 


规划 对 象 家 庭 办 公 室 产品 系列 追踪 的 月 标 对 象 是 否 已 经 在 松 谷 家 具 公 司 的 ISA 中 
目标 家 庭 办 公 室 产品 年 销售 增长 率 至 少 达 16% 
家 庭 办 公 室 产品 年 利润 增长 率 至 少 达 10% 
家 庭 办 公 室 产品 同一 顾客 反复 销售 增长 至 少 达 5% 
每 类 办 公家 具 成 品 的 销售 超过 目标 
使 家 庭 办 公 室 产品 高 于 公司 所 有 产品 的 平均 水 平 
将 完成 办 公 室 产 品 订单 的 时 间 缩 减 5% 
将 接收 办 公 室 产品 发 票 上 最 后 付款 的 时 间 缩 减 5% 
组 织 单元 营销 部 
办 公 室 家 具 产 品系 列 管理 部 
财务 部 
订购 部 
组 织 地 点 区 域 销售 办 公 室 
公司 总 部 
业务 功能 接收 付款 
产品 开发 
人 口 统计 分 析 
目标 市 场 分 析 
营销 和 销售 
履行 订单 
获取 订单 
实体 类 型 CUSTOMER 
PRODUCT 
PRODUCT LINE 
ORDER 
INVOICE 
PAYMENT 
信息 系统 订单 处 理 
销售 管理 


Chris 在 与 Helen 再 次 会 谈 之 前 做 了 两 次 快速 的 分 析 。 第 一 ， 他 确定 和 Helen 所 提 到 的 数据 实 
体 相 关 的 数据 所 在 的 所 有 数据 库 。 利 用 这 些 数 据 库 ，Chris 列 了 一 个 数据 实体 的 所 有 数据 属性 
的 清单 ， 他 认为 Helen 在 分 析 家 庭 办 公 室 家 具 市 场 时 可 能 会 对 这 些 属性 感 兴趣 。Chris 以 前 参与 
开发 公司 标准 销售 跟踪 和 预测 系统 以 及 成 本 会 计 系统 的 经 历 有 助 于 他 从 表 2-4 的 信息 中 推测 
Helen 可 能 需要 什么 样 的 数据 。 例 如 ， 每 类 办 公家 具 成 品 的 销售 超过 目标 意味 着 Helen 在 她 的 系 
统 中 需要 年 销售 目标 ; 再 如 达到 至 少年 销售 增长 率 16% 的 目标 意味 着 系统 需 包括 每 个 产品 前 一 
年 的 订单 。Chris 还 总 结 出 ，Helen 的 数据 库 必须 包括 所 有 产品 而 不 仅仅 是 办 公家 上 共 系 列 ， 因 为 
Helen 想 把 她 的 产品 同 其 他 产品 相 比较 。 然 而 他 可 以 消除 每 个 数据 实体 的 许多 数据 属性 ， 例 如 ， 
Helen 不 需要 许多 客户 数据 ， 如 地 址 、 电 话 号 码 、 联 系 人 、 存 储 尺寸 和 销售 员 。 尽 管 如 此 ， 他 
还 是 包含 少数 属性 (客户 类 型 和 邮政 编码 ， 在 表 2-4 中 未 给 出 )， 他 加 入 这 些 属性 是 因为 这 些 属 
性 在 销售 预测 系统 中 是 非常 重要 的 。 

第 二 ，Chris 根 据 这 张 表 绘制 了 表示 带 有 相关 属性 的 数据 实体 和 实体 间 主 要 联系 的 图 形 化 
的 数据 模型 。Chris 希 望 把 这 张 数据 模型 给 Helen 看 后 ， 能 够 碱 少 系统 开发 过 程 中 分 析 阶 段 的 时 
间 (因此 减少 概念 数据 建 模 的 时 间 )。 图 2-11 是 Chris 绘 制 的 初步 数据 库 的 数据 模型 图 。 表 2-5 列 
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出 了 每 个 实体 的 数据 属性 ，Chris 认 为 这 些 属性 是 Helen 需 要 的 系统 中 应 有 的 。Chris 在 表 2-5 中 
仪 仅 列 出 了 现存 数据 库 中 的 基本 数据 属性 ， 因 为 Helen 为 了 进行 分 析 将 可 能 用 各 种 方式 组 合 这 
些 数 据 。 

2.8.2 分 析 数 据 库 需求 

Chris 与 Helen 的 首次 会 面 仅 有 4 分钟， 但 是 他 感觉 到 对 与 Helen 分 享 他 收集 的 数据 以 及 他 后 
续 的 工作 产生 了 许多 想法 。 他 计划 与 Helen 进 行 一 次 2 个 小 时 的 会 见 ， 以 讨论 他 的 想法 。 在 会 见 
前 ， 他 发 给 Helen 一 个 大 致 的 项 目 进度 表 ， 列 出 了 他 计划 的 步骤 以 及 每 步 所 需 的 上 时间 。 由 于 原 
型 法 是 一 个 用 户 驱 动 的 过 程 ， 期 间 由 用 户 决定 什么 时 候 停止 在 新 的 原型 版 本 上 迭代 ， 所 以 
Chris 仅 能 提供 项 目 基 一 步 持 续 时 间 的 粗略 估计 。 为 此 ，Chris 的 上 司 认为 该 项 日 应 该 与 Helen 商 
议 所 需 时 间 ， 而 不 是 全 定 一 个 固定 的 时 间 。 

Chris 企 与 Helen 的 第 “次 会 面 中 做 了 很 多 事 。 他 系统 地 解释 了 图 2-11 中 每 个 数据 实体 的 含义 ， 
数据 实体 每 个 相关 属性 (在 表 2-5 中 ) 的 含义 ,以 及 实体 间 每 条 线 所 表示 的 业务 策略 和 过 程 。 例 
如 ，Chris 解 释 每 个 订单 是 根据 一 张 发 票 什 账 ， 而 每 张 发 票 对 应 且 仅 对 应 于 一 张 订 单 。 
Order_Number 是 每 份 i 订单 的 惟一 标识 ，-- 张 订单 属于 一 个 客户 。Chris 认 为 Helen 可 能 想 知 道 的 关 
jiT 单 的 数据 还 包括 下 订单 的 日 期 和 完成 订单 的 日 期 (订单 上 的 产品 最 后 发 送 的 日 期 )。Chris 也 
解释 了 Payment_Date 属 性 表示 某 个 订单 客户 最 近 的 支付 日 期 ， 不 管 是 爹 部 支付 还 是 部 分 支付 。 
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图 2-11 产品 营销 支持 系统 的 初步 数据 模型 


表 2-5 初步 数据 模型 中 实体 的 数据 属性 


实体 类 型 属 性 
CUSTOMER Customer_Identifier 
Customer_Name 





Customer_Type 

Customer_ZIPCODE 
PRODUCT Product_ Identifier 

Product_Finish 

Product_Price 

Product_Cost 

Product_Annual_Sales_Goal 
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( 续 ) 
实体 类 型 届 性 
Product_Line_Name 
PRODUCT LINE Product_Line_Name 、 
Product_Line_Annual_Sales_Goal 
ORDER Order_Number 


Order_Placement_Date 
Order_Fulfillment_Date 
Customer_Identifier 
ORDERED PRODUCT Order_Number 
Product_Identifier 
Order_Quantity 
INYVOICE Invoice_Number 
Order_Number 
Invoice_Date 
PAYMENT Invoice_Number 
Payment_Date 
Payment_Amount 





在 讨论 期 间 ，Helen 告 诉 Chris 她 想 要 的 另外 一 些 数据 (客户 购买 松 谷 家 具 公司 产品 的 年 数 
和 完成 每 个 订单 所 必需 的 发 货 量 )。Helen 还 指出 ，Chris 只 提供 每 类 产品 一 年 的 销售 目标 ， 而 她 
需要 去 年 的 销售 目标 和 今年 的 销售 目标 。 当 Helen 对 数据 模型 进行 反馈 时 ，Chris 问 她 想 怎样 使 
用 这 些 数据 ， 此 时 ，Chris 并 不 想 完全 搞 清 这 些 问题 ， 因 为 他 知道 Helen 还 没有 象 正 在 开发 的 信 
息 集 那样 处 理 过 这 样 的 数据 。 因 此 ，Helen 可 能 还 没有 确定 需要 什么 样 的 数据 或 对 这 些 数据 作 些 
什么 。 他 的 目的 是 为 了 理解 Helen 使 用 数据 的 一 些 方式 ， 这 样 ， 他 可 以 开发 一 个 最 初 的 原型 ， 包 
括 数据 库 和 一 些 计算 机 显示 或 报表 。 表 2-6 中 列 出 的 是 Helen 最 后 同意 的 她 所 需要 的 属性 列表 。 

表 2-6 最 终 数据 模型 中 实体 的 数据 属性 


一 一 -一 ~ ” 
实体 类 型 属 性 * 


CUSTOMER Customer_Identifier 
Customer_Name 


Customer_Type 
Customer_ZIPCODE 
Customer_Years 
PRODUCT Product_Identifier 
Product_Finish 
Product_Price 
Product_Cost 
Product_Prior_Year_Sales_Goal 
Product_Current_Year_Sales_Goal 
Product_Line_Name 
PRODUCT LINE Product_Line_Name 
Product_Line._Prior_Year_Sales_Goal 
Product_Line_Current_Year_Sales_Goal 
ORDER Order_Number 
Order_Placement_ Date 
Order_Fulfillment_Date 
Order_Number_of_Shipments 
Customer_Identifier 





实体 类 型 届 性 * 
ORDERED PRODUCT Order Number 
Product_Identifier 
Order_Quantity 
INVOICE Invoice _Number 
Order Number 
Invoice_Date 
PAYMENT Invoice_Number 
Payment_Date 


Payment_Amount 





注 : * 斜 体 表示 与 初步 设计 的 列表 不 同 的 部 分 。 


2.8.3 设计 数据 库 

因为 Chris 采 用 原型 法 并 且 在 前 两 次 与 Helen 的 面谈 中 迅速 确定 了 她 所 需要 的 数据 ， 所 以 
Chris 可 以 立即 建造 一 个 原型 。 首 先 ，Chris 从 公司 的 数据 库 中 提取 Helen 所 提 到 的 数据 实体 和 属 
性 。Chris 用 SQL 查询 语言 来 创建 所 有 这 些 文件 。Helen 想 要 的 一 些 数据 要 从 原始 的 、 操 作 的 数 
据 中 计算 出 来 (如 Customer_Year), 但 是 利用 SQL，Chris 可 以 很 容易 地 指定 这 些 计算 。 抽 取 后 ， 
可 以 为 每 个 数据 实体 产生 一 个 ASCII 文 件 ， 文 件 中 的 每 一 行 包括 数据 模型 中 和 数据 实体 相关 的 
所 有 数据 属性 ， 文 件 中 的 所 有 行 是 它 所 对 应 实体 的 不 同 实例 。 例 如 ，PRODUCT Line 数 据 实体 
的 ASCII 文 件 中 的 每 一 行 包括 产品 系列 名 称 、 去 年 和 今年 的 年 销售 目标 数据 。 

第 二 ，Chris 将 与 Helen 讨 论 后 得 到 的 最 终 的 数据 模型 转换 成 一 系列 的 表 ， 其 中 表 的 列表 示 数 
据 属性 ， 表 的 行 表示 属性 值 的 不 同 集合 。 表 是 关系 数据 库 的 基本 构件 ， 这 是 Microsoft Access 的 
数据 库 风格 。 图 2-12 与 图 2-13 显 示 的 是 Chris 创 建 的 PRODUCT LINE 表 和 PRODUCT 表 (包括 与 之 
相关 的 数据 属性 ) 的 定义 我 们 同时 将 SQL 和 Access 的 定义 表示 在 图 2-13 中 )。Chris 作 这 样 的 转 
换 是 为 了 使 每 张 表 都 有 一 个 称 为 主键 (primary key) 的 属性 ， 它 在 表 的 每 行 中 都 不 相同 。 表 的 
其 他 主要 性 质 包 括 在 每 行 中 ， 每 个 属性 仅仅 有 一 个 值 ， 因 此 如 果 我 们 知道 标识 符 的 值 ， 那 么 其 
他 每 个 属性 都 仅 能 有 惟一 值 。 例 如 ， 对 于 任何 一 个 产品 系列 ， 其 今年 的 销售 目标 仅 有 惟一 值 。 


CREATE TABLE PRODUCT _LINE 
(PRODUCT_LINE_NAME VARCHAR (40) NOT NULL PRIMARY KEY， 


PL_PRIOR_YEAR_GOAL DECIMAL， 
PL_CURRENT_YEAR_GOAL DECIMAL); 





图 2-12 PRODUCT_LINE 表 的 SQL 定义 


数据 库 设 计 包 括 为 每 个 属性 (Access 称 为 属性 字段 ) 指定 格式 或 性 质 。 这 些 设计 决定 在 这 
个 案例 中 很 容易 得 出 ， 因 为 大 多 数 属性 已 经 在 公司 的 数据 字典 中 设计 好 了 。 在 表 2-13b 中 ， 通 
过 字段 名 左边 的 箭头 显示 Product_ID 字 段 的 性 质 。 但 是 ， 少 数 属性 (例如 ORDER 表 中 的 
Order_Number_of_Shipment 属 性 ) 是 利用 松 谷 家 具 公 司 的 数据 库 中 的 原始 数据 计算 得 来 的 ， 所 
以 Chris 不 得 不 为 这 些 属 性 创建 规格 说 明 。 

Chris 关 于 数据 库 设 计 还 必须 作出 的 其 他 主要 决策 包括 在 物理 上 如 何 组 织 数据 库 以 便 以 最 快 
的 速度 对 Helen 的 查询 做 出 响应 。 因 为 数据 库 用 于 决策 支持 的 ， 所 以 无 论 是 Chris 还 是 Helen 都 天 
法 预见 将 来 会 发 生 的 所 有 查询 ， 因 此 Chris 必 须根 据 经 验 做 出 物理 设计 的 选择 ， 而 不 是 根据 使 用 
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数据 库 的 方式 的 知识 来 进行 选择 。Microsoft Access: 和 SQL 人 允许 数据 库 设 计 和 人 员 做 的 关键 的 物理 
数据 库 设 计 决 定 是 在 哪些 属性 上 创建 索引 (索引 就 像 图 书馆 中 的 卡片 目录 ， 通 过 索引 可 以 很 快 
找到 有 具有 共同 特征 的 行 )。 所 有 的 主键 属性 (如 ORDER 表 中 的 Order_ Number) 是 可 以 进行 索引 
的 ， 因 为 它们 在 表 中 的 每 一 行 的 值 都 是 惟一 的 。 另 外 ，Chris 用 了 一 条 经 验 法 则 : 为 任何 一 个 具 
有 超过 10 个 不 同 的 值 且 Helen 可 能 用 它 来 分 割 数 据 库 的 属性 创建 索引 。 例 如 ，Helen 表 示 她 使 用 
数据 库 的 一 种 方式 是 按 产品 使 用 的 漆 来 查看 销售 情况 ， 因 此 在 PRODUCT 表 上 用 Product_Finish 
属性 创建 索引 可 能 会 有 意义 。 然 而 ， 松 谷 家 具 公 司 仅 使 用 六 种 漆 或 木料 类 型 ， 所 以 ， 它 们 不 是 
很 好 的 索引 候选 者 。 另 一 方面 ，Order_Placement_Date ( 称 作 辅 码 ， 因 为 在 ORDER 表 中 不 只 一 
行 具 有 同一 个 值 ) 是 一 个 好 的 索引 候选 ，Helen 想 用 它 来 分 析 不 同 的 类 型 时 期 的 销售 。 在 图 
2-13a 中 查找 主键 ， 在 图 2-13b 中 ， 靠 近 屏 幕 底部 有 一 个 Indexed 框 ， 查 看 该 框 可 以 发 现 选 择 的 属 
性 是 否 被 索引 ， 如 果 已 经 索引 ， 那 么 ， 该 索引 是 否 人 允许 重 复 (主键 是 不 可 以 重复 的 )。 


CREATE TABLE PRODUCT 
(PRODUCT ID INTEGER NOT NULL PRIMARY KEY, 
PRODUCT_FINISH VARCHAR (20), 
PRODUCT_PRICE DECIMAL, 
PRODUCT_COST DECIMAL, 


PR_PRIOR_YEAR GOAL DECIMAL, 
PR_CURRENT YEAR_ GOAL DECIMAL, 
PRODUCT_LINE_NAME VARCHAR (40), 
FOREIGN KEY (PRODUCT LINE_ NAME) REFERENCES 
PRODUCT_LINE (PRODUCT_LINE_ NAME)); 





a) PRODUCT 表 的 SQL 定 义 





[Product Lne_Name 
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b) PRODUCT 表 的 ACCESS 定义 
图 2-13 PRODUCT 表 的 SQL 定义 或 ACCESS 定义 
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图 2-14 显 示 了 Chris 为 家 庭 办 公 室 营销 数据 库 开发 的 数据 模型 的 原型 。 每 个 框 代表 数据 库 中 
的 一 张 表 ， 表 中 的 属性 在 相关 的 框 中 列 出 。 尽 管 表示 关系 的 符号 与 图 2-11 略 有 不 同 ， 但 是 意义 
是 一 样 的 。 例 如 ， 在 图 2-14 中 ， 从 CUSTOMER 实 体 到 ORDER 实 体 有 一 条 线 ， 在 靠近 
CUSTOMER 实 体 一 端 显示 1， 而 在 靠近 ORDER 一 端 显示 一 个 表示 无 穷 的 符号 ， 这 与 图 2-11 中 
的 Place 关系 具有 相同 的 意义 。 


5 区 
0 





图 2-14 家 庭 办 公 室 产品 营销 支持 系统 的 数据 库 定义 一 一 Access 数 据 模型 原型 


2.8.4 使 用 数据 库 
Helen 要 使 用 Chris 为 即席 问题 所 建造 的 数据 库 ， 所 以 ，Chris 将 培训 她 如 何 使 用 Microsotft 
Access， 尤 其 是 数据 库 查 询 特性 。Chris 想 等 系统 设计 得 更 好 一 些 并 且 Helen 从 构建 原型 的 过 程 
中 学 习 了 数据 库 和 Microsoft Access 的 一 些 知识 后 再 培训 她 。 然 而 ，Helen 提 出 她 希望 定期 提出 
一 些 标准 问题 。Microsoft Access 提 供 了 开发 一 些 类 型 的 预 写 例 程 的 功能 ， 这 使 得 Helen 可 以 更 
容易 地 回答 这 些 标准 问题 (所 以 她 不 需要 从 头 开始 为 这 些 问题 编程 ): 
“表单 按 预先 确定 的 格式 定义 的 属性 集合 ， 全 部 基于 一 个 数据 库 记 录 。 因 此 ， 一 个 表单 可 
以 包括 一 个 给 定 顾客 的 数据 ， 也 可 以 包括 一 个 订单 的 数据 和 与 此 订单 相关 的 顾客 的 属性 。 
“报表 ” 按 预先 确定 的 格式 定义 的 属性 集合 ， 它 基于 许多 不 相关 的 记录 。 报 表 通 常 包括 每 
个 记录 的 相同 属性 。 例 如 ， 一 个 报表 可 以 将 所 有 销售 低 于 目标 的 产品 列 出 产品 编号 、 今 
年 的 销售 量 和 今年 的 销售 目标 。 报 表 通 常 包括 页 码 、 每 页 的 标题 、 报 表 的 打印 日 期 和 其 
他 描述 信息 。 
“ 查 均 ”一 个 用 特定 的 查询 语言 (如 按 例 查询 ) 编写 的 问题 ， 它 从 数据 库 中 获取 答案 。 查 
询 的 结果 是 一 张 表 ， 列 是 用 户 想 要 查看 的 属性 ， 行 是 那些 属性 满足 用 户 条 件 的 属性 的 不 
同 实例 。 
在 原型 法 的 开发 过 程 中 ， 随 着 Helen 越 来 越 清楚 地 说 明 她 想 要 系统 完成 什么 功能 ，Chris 可 
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以 开发 出 许多 这 些 例 程 的 例子 。 然 而 ， 在 开发 阶段 的 早期 ，Chris 想 开发 创建 第 一 个 原型 的 例 
程 。Helen 想 要 的 标准 信息 集 之 一 是 家 庭 办 公 室 产品 系列 中 每 一 个 产品 的 清单 ， 其 中 显示 每 个 
品目 前 的 总 销售 量 与 本 年 度 销售 日 标的 比较 。 -个 Access 查 询 就 可 以 产生 这 个 结果 ，Helen 
想 按照 一 种 固定 的 格式 显示 查询 的 结果 ， 这 是 一 个 使 用 报表 的 机 会 ， 但 是 现在 Chris 仅 仅 教 
Helen 用 查询 达到 这 个 目的 。 
图 2-15 显 示 的 是 产生 这 个 产品 清单 的 查询 ， 图 2-16 是 输出 的 一 个 例子 。 图 2-15 中 的 顶部 显 
示 的 是 这 个 查询 所 需 的 数据 模型 中 的 联系 ， 在 底部 显示 的 是 按 例 查询 (QBE) 的 代码 。 如 果 选 
中 一 个 字段 ， 那 么 这 个 字段 将 包括 在 结果 中 。Product_Line_Name 和 Order_Placement_Date 这 两 
个 字段 仅仅 用 于 选择 家 庭 办 公 室 家 具 和 2000 年 的 订单 。PR_Current_Year_Goal 字 段 和 
Product_ID 字 段 上 的 Group By 子 句 告诉 Access 对 每 个 产品 的 销售 量 进 行 汇 总 。 这 个 例子 中 只 
有 限 的 数据 ， 所 以 图 2-16 中 Total Sales 的 结果 是 相当 小 的 ， 但 是 格式 是 图 2-15 中 查询 的 结果 。 
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pp 


3 
5 $26,500.00 4550 
7 $17,000.00 2250 

10 50000  _ 4400 


图 2-16 家 庭 办 公 室 产 品系 列 销售 比较 


Chris 现 在 准备 再 次 会 见 Helen， 看 看 原型 是 否 符合 她 的 需求 。Chris 通 过 运行 Access 和 显示 
图 2-14 ~ 图 2-16 这 样 的 屏幕 向 Helen 展 示 了 他 设计 的 系统 。 当 Helen 提 出 建议 时 ，Chris 能 够 即时 
做 出 少量 修改 ,但 是 Helen 查 看 后 的 许多 意见 要 等 到 他 进行 更 仔细 的 工作 之 后 才能 解决 。 
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由 于 篇 幅 限 制 ， 我 们 无 法 仔细 介绍 开发 家 庭 办 公 室 家 具 营 销 支持 系统 项 目的 每 一 步 。 在 
Helen 觉 得 满意 ， 即 她 所 需 的 所 有 属性 都 在 数据 库 中 之 前 ，Chris 和 Helen 大 约 进 行 了 12 次 面谈 ， 
Chris 写 的 标准 查询 、 表 单 和 报表 对 她 很 有 有 用， 而且， 她 知道 如 何 为 那些 无 法 预期 的 问题 编写 
查询 。 当 Heien 使 用 系统 遇 到 问题 时 ， 包 括 编写 更 复杂 的 查询 、 表 单 或 报表 ，Chris 将 随时 为 
Helen 提 供 咨询 支持 。Chris 和 Helen 做 出 的 最 后 决定 是 判断 最 终 原型 的 性 能 是 否 足够 高 效 ， 如 果 
是 ， 则 无 需 重 写 或 重新 设计 原型 。Helen 现 在 准备 使 用 这 个 系统 。 

2.8.5 管理 数据 库 

家 庭 办 公 室 产品 营销 支持 系统 的 管理 是 相当 简单 的 。Helen 决 定 每 周 从 松 谷 家 具 公 司 的 运 
作 数 据 库 下 载 新 的 数据 到 她 的 Access 数 据 库 中 。Chris 写 了 一 个 嵌 人 了 SQL 命令 的 C 语 言 程 序 以 
执行 必要 的 提取 工作 , 并 且 用 Visual Basic 中 写 了 一 个 Access 程 序 以 从 提取 结果 中 重建 Access 表 ， 
他 计划 在 每 个 星期 天 的 晚上 执行 这 些 工作 。Chris 还 要 更 新 公司 信息 系统 体系 结构 模型 以 包括 
家 庭 办 公 室 产品 营销 支持 系统 。 这 一 步 非常 重要 ， 因 为 当 Helen 的 系统 中 包含 的 数据 的 格式 发 
生变 化 时 ， 公 司 的 CASE 工 具 可 以 警告 Chris 这 些 改变 可 能 会 影响 她 的 系统 。 


本 章 小 结 


本 章 讨论 了 开发 数据 库 及 其 应 用 的 过 程 。 数 据 库 开发 从 企业 数据 建 模 开 始 ， 此 时 建立 组 织 
数据 库 的 范围 和 一 般 内 容 。 企 业 数 据 建 模 是 为 一 个 组 织 开 发 信息 系统 体系 结构 (包括 数据 、 过 
程 、 网 络 、 人 、 事 件 和 原因 ) 的 全 部 过 程 的 一 部 分 。 为 开发 信息 系统 体系 结构 而 采用 的 一 个 流 
行 的 方法 是 信息 工程 ， 它 是 一 种 自 顶 向 下 的 信息 系统 规划 方法 。 

信息 系统 规划 必须 考虑 到 组 织 目 标 、 关 键 成 功 因素 和 组 织 的 问题 领 戌 。 在 信息 系统 规划 期 
间 ， 数 据 实 体 应 该 与 组 织 的 其 他 规划 对 象 相 联系 ， 这 些 对 象 包括 组 织 单元 、 地 点 、 业 务 功 能 和 
信息 系统 。 业 务 功能 通过 功能 分 解 过 程 可 以 分 解 以 各 种 详细 级 别 来 表示 。 数 据 实体 间 的 联系 和 
其 他 组 织 规 划 对 象 能 够 表示 在 更 高 级 别 的 规划 和 手 阵 中 ， 规 划 和 矩阵 有 助 于 理解 联系 的 模式 。 

无 论 是 从 信息 系统 规划 还 是 从 一 个 特定 的 请 求 (例如 Helen jarvis 要 求 建立 一 个 家 庭 办 公 室 
产品 营销 支持 系统 )， 一 且 数 据 库 的 需求 确定 ， 就 可 以 组 成 一 个 项 目 团队 以 开发 各 个 部 分 。 项 
目 团队 按照 某 种 系统 开发 过 程 进 行 开发 ， 例 如 系统 开发 生命 周期 法 或 原型 法 。 系 统 开 发 生命 周 
期 法 可 以 表示 为 7 个 步 又 : 1) 项 目 论证 和 选择 阶段 ; 2) 项 目 开 始 和 规划 阶段 ; 3) 分 析 阶 段 ; 
4) 逻辑 设计 阶段 ，5) 物理 设计 阶段 ; 6) 实现 阶段 ; 7) 维护 阶段 。 数 据 库 开 发 活动 发 生 在 这 
些 相互 重 释 的 每 一 个 阶段 中 ， 而 反馈 的 发 生 可 能 导致 项 目 返 回 到 上 一 个 阶段 。 在 原型 法 中 ， 数 
据 库 及 其 应 用 是 通过 系统 开发 人 员 和 用 户 的 紧密 交互 而 反复 改进 的 。 当 数据 库 应 用 规模 很 小 、 
单机 运行 且 系 统 用 户 数 很 少时 采用 原型 法 更 好 。 

在 整个 系统 开发 过 程 中 ，CASE 工 具 用 于 开发 数据 模型 并 维护 数据 库 和 应 用 的 元 数据 。 信 
息 库 维护 所 有 的 文档 。 在 数据 库 开发 项 目 中 ,许多 人 可 以 使 用 CASE 工 具 和 相关 的 信息 库 ， 这 
些 人 员 包 括 : 系统 分 析 员 、 数 据 库 分 析 员 、 用 户 、 程 序 员 、 数 据 库 和 数据 管理 员 以 及 其 他 技术 
专家 。 当 项 目的 一 个 新 的 重要 的 部 分 完成 时 ， 并 记录 在 信息 库 中 时 ， 应 该 设置 一 个 检查 点 。 在 
一 个 检查 点 上 ， 那 些 为 项 目 工作 的 人 和 为 项 目 提供 资金 与 人 力 资源 的 人 可 以 评估 项 目 进度 ， 并 
在 基于 递增 完成 的 情况 决定 是 否 再 进行 投入 。 

数据 库 开发 项 目的 工作 人 员 为 数据 库 处 理 三 种 视图 或 模式 : 1) 概念 模式 ， 它 提供 完全 的 、 
与 技术 无 关 的 数据 库 视 图 ; 2) 物理 模式 或 内 部 模式 ， 确 定 完全 的 存储 在 计算 机 -- 级 存储 器 中 
的 数据 库 ，3) 外 部 模式 或 用 户 视图 ， 描 述 与 一 个 特定 用 户 相关 的 数据 库 的 子 集 。 

现代 的 数据 库 及 其 应 用 可 能 分 布 在 多 个 计算 机 上 。 尽 管 可 以 存在 许多 层次 ， 但 是 处 理 数据 库 
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的 客户 /服务 器 体系 结构 分 为 三 层 : 1) 客户 层 ， 将 数据 库 内 容 显示 给 用 户 ; 2) 应 用 /Web 服 务 层 ， 
分 析 数 据 库 的 内 容 和 管理 用 户 会 话 ; 3) 企业 服务 器 层 ， 将 组 织 间 的 数据 合并 为 一 个 组 织 资产 。 
在 本 章 结尾 ， 我 们 介绍 了 假想 的 松 谷 家 具 公 司 中 的 数据 库 开发 项 目 。 这 个 家 庭 办 公 室 家 具 
产品 的 营销 支持 系统 说 明了 个 人 数据 库 管理 系统 的 用 法 ， 以 及 Microsoft Access 和 开发 仅 用 于 检 
索 的 数据 库 的 SQL 编码 的 用 法 。 这 个 应 用 中 的 数据 库 包 括 从 企业 数据 库 中 提取 的 数据 ， 然 后 存 
储 到 客户 层 一 个 单独 的 数据 库 中 。 开 发 这 个 数据 库 应 用 采用 了 原型 法 ， 由 于 用 户 Helen Jarvis 具 
有 相当 多 非 结 构 化 的 需求 ， 所 以 ， 只 有 通过 开发 和 精 化 系统 的 不 断 迭 代 才 能 更 好 地 了 解 其 需求 。 











本 章 复 习 
关键 术语 
业务 功能 客户 /服务 器 体系 结构 计算 机 辅助 软件 工程 (CASE) 
概念 模式 企业 数据 建 模 功能 分 解 
增 量 投入 信息 工程 信息 系统 体系 结构 (ISA) 
物理 模式 项 目 原型 法 
示 息 库 系统 开发 生命 周期 (SDELC ) 自 顶 向 下 规划 
复习 问题 
1. 定义 以 下 术语 : 
a. 信息 系统 体系 结构 (ISA) b. 系统 开发 生命 周期 (SDLC ) 
c. 客 户 /服务 器 体系 结构 d. 增 量 投入 
e. 企业 数据 模型 f. 概念 数据 建 模 
2. 将 下 列 术 语 与 定义 匹配 起 来 : 
概念 模式 a. 重复 分 解 一 个 功能 到 更 细 的 细节 
_ 业务 功能 b. 定期 检查 系统 开发 项 目 点 
-原型 法 c. 一 种 快速 的 系统 开发 方法 
系统 开发 生命 周期 法 d. 业务 数据 的 全 面 描述 
功能 分 解 e. 对 信息 系统 需求 获得 一 个 广泛 的 理解 
自 顶 向 下 规划 f. 一 组 相关 的 业务 过 程 
_ 增 量 投入 g. 存储 在 二 级 存储 器 中 的 数据 结构 
-物理 模式 h. 一 个 结构 化 的 、 逐 步 的 系统 开发 方法 
3. 比较 下 列 术语 : | 
a. 物理 模式 ; 概念 模式 b. 系统 开发 生命 周期 法 ; 原型 法 
c. 自 顶 向 下 规划 ; 功能 分 解 d. 企业 数据 建 模 ; 信息 工程 


e. 信息 库 ; 计算 机 辅助 软件 工程 

列 出 和 解释 信息 工程 的 四 个 阶段 。 

.描述 信息 工程 规划 阶段 的 三 个 步骤 。 

列 出 并 解释 三 个 信息 工程 的 战略 上 的 规划 因素 。 

列 出 和 定义 五 个 关键 的 组 织 的 规划 目标 。 

说 明 在 信息 系统 与 数据 库 开 发 中 进行 功能 分 解 的 意义 。 

说 明 信 息 系统 开发 中 信息 系统 规划 和 矩阵 的 用 途 。 

10. 给 传统 系统 开发 生命 周期 的 七 个 阶段 命名 ， 并 说 明 每 一 阶段 的 目的 与 交付 产品 。 
4 SDLC 的 七 个 阶段 中 ， 哪 一 阶段 出 现 数据 库 开 发 活动 ? . 
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12. 详细 说 明 用 原型 法 进行 系统 开发 的 步骤 。 哪 个 数据 库 开 发 活动 出 现在 每 个 原型 法 步 
又 中 ? 
13. 说 明 同 一 数据 库 的 用 户 视图 、 概 念 模式 和 物理 模式 之 间 的 不 同 。 
14. 必须 以 特定 的 顺序 设计 外 部 模式 与 概念 模式 吗 ? 说 明 原 因 。 
15. 详细 说 明 三 层 数据 库 体 系 结构 。 
16. 在 三 层 数据 库 体 系 结构 中 ， 在 某 一 个 层 上 可 能 没有 数据 库 吗 ? 若 不 可 能 ， 为 什么 ? 车 
可 能 ， 请 举例 。 
17. 列 出 信息 系统 体系 结构 (ISA) 的 六 个 主要 组 成 部 分 。 其 中 哪个 部 分 与 数据 库 设 计 有 
关 ? 为 什么 ? 
18. 将 系统 开发 生命 周期 法 (SDLC) 比 作 瀑布 有 何 意义 ? 
19. 在 数据 库 开 发 过 程 中 何 时 绘制 实体 -联系 图 ? 同一 数据 库 的 不 同 图 表 是 如 何 互相 区 别 的 ? 
20. 实现 客户 /服务 器 数据 库 体 系 结构 的 原因 是 什么 ? 
问题 和 练习 
1. 瀑布 比喻 能 够 恰当 地 形容 SDLC 吗 ? 说 明 你 对 这 个 比喻 的 疑问 。 
2. 按照 更 有 用 的 顺序 重新 安排 图 2-3 的 行 与 列 。 你 为 什么 选择 这 个 新 顺序 来 安排 行 和 列 ? 
你 现在 运用 这 个 重组 的 矩阵 的 目的 是 什么 ? 
3. 列 出 松 谷 家 具 公 司 的 企业 数据 模型 ( 见 图 2-1) 中 可 以 出 现 的 三 个 其 他 的 实体 。 
4. 将 你 所 在 的 商学 院 或 其 他 的 学 院 看 作 一 个 企业 。 
a. 定义 若干 个 功能 并 且 至 少 功 能 分 解 到 三 个 层次 。 
b. 定义 若干 个 主要 的 数据 实体 类 型 ， 并 绘制 初步 的 企业 数据 模型 (所 用 符号 与 图 2-1 类 
似 )。 
c. 以 练习 a 的 最 低层 次 功能 为 行 ， 练 习 b 的 数据 实体 类 型 为 列 ， 开 发 规划 和 矩阵。 参照 图 
2-3， 填 写 矩 阵 单元 。 
d. 定义 学 院 的 四 个 重要 成 功 因素 (CSF)。 
e. 你 的 商学 院 或 其 他 学 院 是 否 可 以 从 数据 的 多 层 体系 结构 中 受益 ? 说 明 其 中 的 原因 。 
5. 考虑 你 所 参加 的 学 生 俱乐部 。 
a. 定义 若干 个 俱乐部 使 用 的 信息 系统 (人 工 或 自动 的 )。 
b. 定义 若干 个 主要 的 数据 实体 类 型 ， 并 绘制 初步 的 企业 数据 模型 (使 用 的 符号 与 图 2-1 
类 似 )。 
c. 开 发 一 个 信息 系统 -数据 实体 的 规划 矩阵 。 填 写 每 个 单元 格 以 表示 每 一 信息 系统 是 如 
何 与 每 一 数据 实体 相互 作用 的 (单元 格 用 字母 C 表 示 该 实体 创建 的 新 的 实例 ，R 表 示 
检索 那个 实体 的 数据 ，U 表 示 更 新 实体 的 数据 值 ，D 表 示 删 除 实 体 的 实例 )。 
d. 重组 练习 c 的 答案 中 的 行 和 列 ， 尽 你 所 能 来 创建 一 个 具有 实体 的 单元 沿 着 主 对 角 线 的 
而 空白 单元 远离 主 对 角 线 的 矩阵 。 这 个 重组 的 矩阵 能 说 明 什么 问题 ? 
6. 假设 一 个 业务 功能 -数据 实体 的 规划 和 矩阵。 假设 通过 研究 这 个 规划 和 矩阵 ， 你 确定 业务 功 
能 中 的 3 个 功能 来 提供 5 个 数据 实体 的 大 部 分 使 用 。 这 对 确定 开发 用 的 数据 库 有 什么 上 暗示? 
7. 考虑 表 2-3， 根 据 这 张 表 中 的 信息 开发 一 个 假设 的 信息 系统 -实体 类 型 矩阵 。 假 设 信息 系 
统 中 的 每 个 实体 可 以 创建 、 检 索 、 更 新 和 删除 数据 ， 单 元 格 中 用 字母 C 表 示 创 建 ，R 表 示 检 索 ， 
0 表示 更 新 ，D 表 示 删 除 。 由 于 所 列 的 信息 系统 包括 事务 处 理 和 管理 信息 系统 ， 你 将 遵守 什么 
样 的 实体 使 用 模式 ? 
8. 考虑 表 2-3， 开 发 关于 产品 开发 业务 功能 的 一 个 假设 的 功能 分 解 ， 类 似 于 图 2-2 中 显示 的 
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订单 履行 功能 。 你 的 图 中 有 任何 与 图 2-2 相 同 的 子 功能 吗 ? 为 什么 ? 

9. 解释 企业 数据 模型 和 概念 数据 模型 之 间 的 区 别 。 每 一 个 模型 代表 多 少 个 数据 库 ? 每 个 模 
型 所 对 应 的 组 织 的 范围 是 多 少 ? 其 他 明显 的 区 别 是 什么 ? 

10. 在 物理 数据 库 设 计 和 数据 库 开 发 的 创建 阶段 ， 你 是 否 有 可 能 想 返 回 到 逻辑 数据 库 设 计 
阶段 ”说 明 其 中 的 原因 。 如 果 可 能 ， 给 出 一 个 例子 说 明 在 物理 数据 库 和 设计 阶段 会 让 你 重新 考 
虑 先前 的 概念 和 外 部 数据 库 设计 。 

11. 比较 数据 库 开 发 在 概念 数据 建 模 阶 段 的 自 顶 向 下 的 本 质 和 逻辑 数据 库 设计 阶段 的 自 底 
向 上 的 本 质 。 在 这 两 个 数据 库 设计 阶段 考虑 的 信息 类 型 存在 什么 主要 差别 ? 

12. 用 原型 法 进行 系统 开发 的 目标 是 迅速 建造 和 重建 一 个 信息 系统 ， 用 户 和 系统 分 析 员 从 
原型 的 使 用 中 了 解 什么 特征 应 该 包括 在 改进 后 的 信息 系统 中 。 由 于 最 后 的 原型 不 是 必须 成 为 一 
个 工作 系统 ， 哪 里 是 你 认为 最 理想 的 开发 原型 的 地 点 : 个 人 计算 机 、 工 作 组 计算 机 、 部 门 计算 
机 ， 还 是 企业 服务 器 ? 你 的 回答 基于 什么 假设 ? 

13. 考虑 一 个 你 经 常 与 之 打交道 的 组 织 ， 如 银行 、 信 用 卡 公司 、 大 学 或 保险 公司 ， 你 从 中 
接受 过 一 些 计算 机 产生 的 消息 ， 如 每 月 结算 表 、 交 易 单 等 等 。 描 述 你 从 组 织 收 到 的 每 个 消息 中 
的 数据 作为 它 自己 的 用 户 视图 ， 用 图 2-1 中 的 符号 表示 这 些 视图 。 现 在， 合并 所 有 视图 到 一 个 概 
念 数 据 模型 ， 同 样 是 使 用 图 2-1 中 的 符号 。 在 合并 不 同 的 用 户 视图 时 ， 你 观察 到 了 什么 ?不 同 的 
用 户 视图 间 存 在 不 一 致 的 地 方 吗 ? 一 旦 你 创建 了 概念 数据 模型 ， 你 愿意 再 修改 用 户 视图 吗 ? 

14. 考虑 图 2-10， 它 描述 了 一 个 假设 的 三 层 数据 库 体 系 结构 。 确 定 图 中 各 个 数据 库 间 潜 在 
的 数据 重复 。 这 些 重复 可 能 导致 什么 问题 ? 这 些 重复 违反 了 第 1 章 中 列 出 的 数据 库 方法 的 原则 
了 呜 ?说 明 其 中 的 原因 。 

15. 考虑 图 2-11， 解释 ORDER 和 INVOICE 间 连 线 的 含义 ， 以 及 INVOICE 和 PAYMENT 间 连 
线 的 含义 。 它 们 是 怎样 说 明 松 谷 家 具 公 司 与 客户 交易 的 ? 

16. 回答 下 列 有 关 图 2-12 和 图 2-13 的 问题 : 

a. 在 PRODUCT 表 中 ，Product_Line_Name 字 段 的 长 度 是 多 少 ” 为 什么 ? 
b. 在 图 2-13b 中 ，PRODUCT 表 中 的 Product_ID 字 段 为 什么 必须 被 指明 ? 
c. 在 图 2-13b 中 ， 为 什么 Product_ID 与 产品 表 的 一 个 键 相 邻 ? 

d. 图 2-13a 中 ，SQL 语 名 的 最 后 一 行 有 什么 作用 ? 

17. 考虑 图 2-1$ 中 的 Access 查 询 。 

a. 为 什么 在 这 个 查询 中 必须 包括 Order Placement_Date 这 个 字段 ， 即 使 它 不 显示 在 查询 
结果 中 ? 
b. 如 果 Helen Jarvis 想 看 到 全 部 产品 系列 的 结果 ， 而 不 仅仅 是 家 庭 办 2 公 室 产品 系列 的 结 
果 ， 必 须 怎样 修改 查询 ? 
18. 如 果 观 察 第 3 章 中 的 图 3-22， 你 将 看 到 松 谷 家具 公司 数据 库 的 部 分 实体 ~ 联系 图 。 


PRODUCT LINE 实 体 的 图 如 下 : 
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解释 PRODUCT LINE 的 两 种 不 同 定 义 间 的 差别 。 
应 用 练习 

1. 会 见 不 同 组 织 中 的 系统 分 析 员 与 数据 库 分 析 员 。 请 他 们 描述 他 们 的 系统 开发 过 程 。 这 个 
过 程 属 于 系统 开发 生命 周期 法 还 是 原型 法 呢 ? 他 们 运用 了 类 似 于 这 种 两 种 方法 的 方法 吗 ? 他们 
何 时 运用 不 同 的 方法 ”探索 开发 一 个 通过 网 络 使 用 的 应 用 的 方法 。 他 们 如 何 改编 方法 以 适合 这 
个 新 的 系统 开发 过 程 ? 

2. 选择 一 个 你 熟悉 的 组 织 ， 它 可 能 是 你 工作 的 单位 、 你 的 学 校 或 者 你 朋友 工作 的 单位 。 儿 
对 这 个 系统 ， 描 述 它 的 信息 系统 结构 (ISA)。 这 个 系统 有 一 个 正式 准备 过 的 体系 结构 吗 ， 或 者 
你 必须 创建 一 个 新 的 体系 结构 ”会 见 这 一 组 织 中 的 信息 系统 管理 员 以 找 出 他 们 为 什么 正式 认可 
ISA。 

3. 选择 一 个 你 熟悉 的 组 织 ， 它 可 能 是 你 工作 的 单位 、 你 的 学 校 或 者 你 朋友 工作 的 单位 。 考 
虑 这 个 组 织 中 的 主要 数据 库 ， 例 如 一 个 支持 客户 交互 的 数据 库 、 会 计数 据 库 或 者 生产 数据 库 。 
这 个 数据 库 的 体系 结构 如 何 ” 这 个 组 织 运 用 了 某 种 形式 的 客户 /服务 器 体系 结构 吗 ” 咨 询 这 个 
信息 系统 的 管理 员 以 找 出 他 们 为 这 个 数据 库 选 择 此 结构 的 原因 。 

4. 选择 一 个 你 熟悉 的 组 织 ， 它 可 能 是 你 工作 的 单位 、 你 的 学 校 或 者 你 朋友 工作 的 单位 。 咨 
询 系统 分 析 员 和 数据 库 分 析 员 并 询问 有 关 信 息 系统 开发 团队 的 典型 构成 。 具 体 而 言 ， 一 个 数据 
库 分 析 员 在 项 目 组 中 扮演 什么 角色 ? 一 个 数据 库 分 析 员 服务 于 整个 系统 开发 过 程 还 是 仅仅 服务 
于 被 选择 的 点 上 呢 ? 

5. 选择 一 个 你 熟悉 的 组 织 ， 它 可 能 是 你 工作 的 单位 、 你 的 学 校 或 者 你 朋友 工作 的 单位 。 咨 
询 系统 分 析 员 和 数据 库 分 析 员 并 询问 有 关 该 组 织 在 系统 开发 过 程 中 如 何 运用 CASE 工 具 的 问题 。 
把 问题 集中 于 CASE 工 具 如 何 应 用 于 数据 建 模 与 数据 库 设计 和 CASE 工 具 的 信息 库 如 何 维护 收 
集 的 数据 、 数 据 特性 和 数据 用 法 的 信息 。 如 果 有 多 个 CASE 工 具 应 用 于 一 个 或 多 个 项 目 ， 考 察 
这 个 组 织 如 何 整合 数据 模型 和 数据 定义 。 最 后 ， 询 问 系统 分 析 员 和 数据 库 分 析 员 对 这 个 支持 数 
据 建 模 和 数据 库 设计 的 CASE 工 具 的 满意 度 如 何 。 
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项 目 案例 : 山 景 社区 医院 


项 目 描述 

在 第 1 章 已 介绍 过 山 景 社区 医院 。 图 2-17 表 示 2001 年 1 月 1 日 山 景 社区 医院 的 组 织 图 表 。 像 
大 多 数 普通 医院 一 样 ， 山 景 社区 医院 分 为 两 个 主要 的 组 织 团体 。 由 Dr. Browne 领 导 的 医生 组 负 
页 病人 医疗 的 质量 。Ms. Baker (管理 者 ) 协助 医生 向 病人 提供 护理 、 疗 养 以 及 临床 管理 方面 
的 服务 。 

() 目标 与 主要 成 功 因素 
正如 第 1 章 所 述 ， 山 景 社区 医院 的 基本 目标 是 为 其 周围 社区 提供 高 质量 的 医疗 服务 ， 同 时 在 
近 儿 年 金 国 各 行业 成 本 呈 增 长 趋势 的 前 提 下 维持 成 本 不 变 。 山 景 社区 医院 为 一 个 人 口 约 有 50 000、 
年 增长 率 为 10% 的 社区 服务 ， 由 于 周边 地 区 吸引 了 越 来 越 多 的 退休 者 ， 所 以 这 个 增长 的 趋势 还 
将 继续 下 去 。 因 此 山 景 社区 医院 有 一 个 目标 是 扩展 它 的 容量 (5 年 内 增加 50 个 床位 ) 并 成 立 一 个 
退休 人 员 医疗 中 心 ， 该 中 心 具 有 独立 的 房间 和 生活 设施 。 目 前 ， 在 医院 的 周围 有 充足 的 土地 可 
供 医院 扩建 。 由 于 这 次 扩建 ， 山 景 社区 医院 计划 增加 管理 者 的 人 数 和 医疗 人 员 的 人 数 ， 成 立 _- 
个 新 的 由 Ms. Baker 负 责 的 退休 人 员 生 活 部 和 一 个 新 的 由 Dr. Browne 负 责 的 老年 内 科 部 。 








Ms. Baker, 


| 







Dr Browne, 
院 长 
Ms. Crowley, 
助理 
Dr Jefferson， 
外 科 主 任 








Mr Heller, 
信息 系统 
















Mr Thomas, 
牧师 
十 
Mr Lopez， Ms. Knight， 
助理 管理 员 扩 二 长 
| 
了 


门诊 部 主任 
Mr Clay, Mr Davis, 
Ms. Alverez， 接待 和 Ms. Stevens， a 
图 2-17 2001 年 1 月 的 组 织 图 


为 了 适应 山 景 社区 医院 的 稳定 成 长 和 扩建 ， 一 个 由 Mr. Heller、Mr. Lopez、Dr. Jefferson 和 
一 名 顾问 组 成 的 特别 研究 小 组 已 经 开发 了 一 个 长 期 的 业务 规划 ， 包括 医院 的 信息 系统 规划 。 他 
们 的 工作 尚未 完成 ， 但 是 他 们 已 经 确定 了 实现 这 个 规划 必须 的 许多 元 素 。 为 了 满足 高 质量 的 医 
疗 服务 、 保 持 成 本 和 增加 新 的 服务 等 目标 ， 特别 研究 小 组 总 结 出 医院 有 4 个 关键 成 功 因素 : 医 
















Ms. Price， 












Dr Redfern, 
内 科 主 任 
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疗 质量 、 控 制 运作 成 本 、 控 制 资 本 成 本 、 招 募 和 留 住 专 
业 人 才 (尤其 是 护士 ) 。 改 进 的 信息 系统 的 开发 应 该 有 
能 力 处 理 以 上 每 一 个 关键 成 功 因 素 。 

小 组 当前 的 工作 是 为 每 个 关键 成 功 因素 确定 2 ~ 4 个 
短期 或 长 期 目标 。 到 目前 为 止 ， 他 们 为 控制 运作 成 本 这 
个 关键 成 功 因素 开发 了 以 下 四 个 目标 : 

1) 减少 采购 成 本 。 

2) 更 有 效 地 安排 员工 。 

3) 降低 责任 保险 成 本 。 

4) 扩大 志愿 者 服务 。 

研究 小 组 更 详细 地 撕 述 了 每 一 个 关键 成 功 因 素 和 目 
标 ， 并 将 这 些 描述 存 入 一 个 信息 库 ， 这 个 信息 库 由 信息 
系统 部 门 使 用 的 CASE 工 具 来 管理 。 

(2) 企业 建 模 

研究 小 组 还 开发 了 一 个 业务 功能 的 初步 清单 ， 其 中 
描述 了 医院 内 的 管理 活动 和 医疗 活动 。 这 些 功 能 考虑 了 
组 织 目标 和 前 一 小 节 解 释 的 关键 成 功 因 素 。 此 时 ， 研 究 
小 组 确定 了 5 个 主要 的 业务 功能 ， 它 们 涉及 所 有 的 组 织 
单元 。 这 5 个 业务 功能 有 : 

“病人 医疗 管理 管理 后 勤 和 病人 的 医疗 记录 。 

“临床 服务 ”提供 实验 室 测 试 和 程序 ， 以 及 病人 监 

控 和 显示 。 

。 病 人 医疗 服务 为 病人 提供 医疗 护理 和 支持 服务 。 

“财务 管理 管理 财务 资源 和 医院 的 运作 。 

“管理 性 服务 ”提供 并 非 与 病人 护理 直接 相关 的 一 

般 的 管理 和 支持 服务 。 

研究 小 组 把 每 个 高 层次 的 功能 分 解 为 更 详细 的 功能 
(参见 图 2-18 ) ， 但 是 他 们 知道 此 时 这 个 清单 既 不 完整 ， 
也 不 是 很 好 。 

人 研究 小 组 最 初 有 一 个 具有 10 个 实体 类 型 的 初步 集 
合 ， 这 个 集合 描述 了 医院 在 运作 和 管理 中 所 需 的 数据 。 
它们 是 FACILITY (设施 )、PHYSICIAN (医生 )、 
PATIENT (病人 )、WARD (病房 )、STAFF (职员 )、 
LABORATORY (实验 室 )、TEST (化 验 )、MEDICAL/ 
SURGICAL ITEM (内 科 / 外 科 项 目 )、SUPPLY ITEM 
(供应 品 ) 和 VENDOR (供应 商 )。 与 医院 员工 进行 讨 
论 并 检查 医院 的 文档 和 研究 现存 的 信息 系统 后 ， 研 究 小 
组 开发 了 业务 规则 的 一 个 清单 ， 它 描述 了 医院 的 政策 和 
管理 这 些 实体 间 的 联系 的 医 运 运作 的 本 质 。 其 中 一 些 规 
则 是 : 

]) 一 个 FACILITY 维 护 一 组 LABORATORY: 放射 







检查 报告 
















电子 诊断 
精神 病 学 检查 


放射 学 检查 
病人 医疗 服务 















1 









评价 志愿 者 
图 2-18 业务 功能 
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科 、 电 子 诊断 、 血 液 学 等 等 。 

2) 一 个 FACILITY 包 括 一 组 WARD (产房 、 急 诊室 、 康 复 室 、 老 年 病 科 等 等 ) 。 

3) 给 每 个 WARD 分 配 一 定数 量 的 STAFF (护士 、 秘 书 等 等 )， 一 个 STAFF 可 能 属于 多 个 
WARD。 

4) 一 个 FACILITY 配 备 一 组 PHYSICIAN 的 医疗 小 组 。 一 个 PHYSICIAN 可 能 为 多 个 
FACILITY 工 作 。 

5) 一 个 PHYSICIAN 治 疗 许多 PATIENT，.-- 个 PATIENT 可 以 被 许多 的 PHYSICIAN 治 疗 。 

6) 一 个 PHYSICIAN 诊 断 许多 PATIENT， 一 个 PATIENT 可 以 被 许多 的 PHYSICIAN 诊 断 。 

7) 一 个 PHYSICIAN 可 能 被 分 配 到 一 个 WARD (门诊 病人 没有 被 分 配 WARD )。 医 院 仅 关心 
病人 当前 的 WARD (如 果 有 病房 )。 

8) 一 个 PATIENT 使 用 MEDICAL/SURGICAL ITEM ， 它 们 由 多 个 VENDOR 供 应 。VENDOR 
也 提供 用 于 内 务 处 理 和 维护 用 途 的 SUPPLY ITEM。 

9) - -个 LABORATORY 对 多 个 PATIENT 进行 多 种 TEST。 






Maintains Contains 




















Performed for ls assigned to 










Provides 


oe | 
图 2-19 初步 的 企业 数据 模型 


他 们 认识 到 某 些 业务 功能 ， 如 风险 管理 和 志愿 服务 ， 无 法 用 一 组 数据 实体 和 业务 规则 表示 
清楚 ， 但 是 他 们 决定 以 后 再 处 理 这 些 问 题 和 其 他 问题 。 研 究 小 组 把 这 些 数据 实体 和 业务 规则 的 
描述 存储 到 CASE 工 具 的 信息 库 中 供 以 后 分 析 。 使 用 确定 的 实体 和 业务 规则 ， 研 究 小 组 开发 了 
一 个 初步 的 企业 数据 模型 (参见 图 2-19)。 因 为 这 个 企业 数据 模型 的 目的 仅仅 是 给 出 组 织 数据 的 
一 个 概述 ， 它 不 遵循 信息 系统 部 门 绘制 数据 模型 使 用 的 所 有 约定 ， 所 以 这 个 数据 模型 是 初步 的 。 

(3) 开发 规划 矩阵 

癸 究 小 组 使 用 CASE 工 具 来 产生 功能 -实体 类 型 矩阵 的 第 一 个 版 本 〈 参 见 图 2-20)。 这 个 拭 
阵 将 业务 功能 映射 到 图 2-18 中 的 !0 个 数据 实体 上。 和 矩阵 中 每 一 个 单元 格 编码 的 含义 如 下 : 

M = 功能 维护 实体 的 实例 (创建 、 更 新 和 删除 ) 
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R = 功能 使 用 关于 实体 的 数据 
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M = 数据 实体 ( 列 ) 由 业务 功能 ( 行 ) 维护 
R= 数据 实体 ( 列 ) 由 业务 功能 ( 行 ) 使 用 


图 2-20 业务 功能 -数据 实体 矩阵 
作为 矩阵 的 最 初 情况 ， 研 究 小 组 决定 不 单独 编码 数据 创建 、 更 新 和 删除 这 些 活动 。 
降 究 小 组 还 使 用 CASE 工 具 将 业务 功能 与 四 个 关键 成 功 因素 相关 联 (图 2-21 为 工作 的 结果 )。 
在 图 2-21 中 ， 单 元 格 的 含义 是 : 
E= 做 好 此 项 功能 是 实现 关键 成 功 因素 的 基础 
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D = 做 好 此 项 功能 对 实现 关键 成 功 因素 有 帮助 


关键 成 功 因 素 ， 
(CSF) 


业务 功能 
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病人 安排 
闹 人 挂号 


医 牛 医嘱 
检查 报告 
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| 护理 
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E = 业务 功能 ( 行 ) 在 实现 CSF ( 列 ) 中 是 必要 的 
D = 业务 功能 ( 行 ) 在 实现 CSF ( 列 ) 中 是 令 人 满意 的 


图 2-21 业务 功能 -关键 成 功 因 素 矩 阵 
研究 小 组 正在 寻找 途径 结合 图 2-20 和 图 2-21 中 显示 的 结果 ， 以 帮助 他 们 为 信息 系统 开发 活 
动 设 定 优先 级 。 
项 目 问 题 
1) 哪个 信息 系统 规划 矩阵 在 这 个 案例 研究 中 显示 的 和 未 显示 的 盾 阵 ) 可 能 帮助 山 景 社区 
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医院 的 研究 小 组 为 数据 库 人 确定 一 个 层次 化 位 置 规划 ? 为 什么 ? 

2) 在 上 面 的 项 目 描述 中 ， 列 出 了 控制 运行 成 本 的 目标 ， 控 制 运行 成 本 是 四 个 关键 成 功 因 素 
之 一 。 根 据 给 定 的 人 医院 的 结构 和 规划 ， 为 其 他 的 关键 成 功 因素 列 出 可 能 的 目标 。 

3) 在 “志愿 服务 ”业务 功能 中 出 现 了 哪些 另外 的 活动 ? 

4) 哪些 活动 可 能 出 现在 “风险 管理 ”业务 功能 中 ? 

5) 在 这 个 案例 中 ， 除 了 提 到 的 10 个 实体 外 ， 风 险 管理 功能 可 能 需要 哪些 附加 的 数据 实体 ? 

6) 你 认为 研究 小 组 通过 他 们 已 经 完成 的 分 析 能 够 确定 所 有 的 数据 实体 吗 ? 如 果 不 行 ， 还 要 
进行 哪些 其 他 的 数据 库 开 发 步骤 ? 何 时 做 ? 

7) 你 认为 业务 规划 研究 小 组 的 成 员 是 依据 什么 选 出 的 ? 你 会 选择 不 同 的 人 或 其 他 的 人 吗 ? 

8) 在 上 面 的 案例 描述 中 ， 列 出 了 9 个 业务 规则 ， 研 究 小 组 用 这 些 规 则 开发 了 图 2-19。 除 了 
这 9 个 规则 外 ， 图 2-19 还 描述 或 暗示 了 哪些 其 他 的 业务 规则 ? 

9) 尽管 资本 成 本 控制 是 一 个 关键 成 功 因 素 ， 但 是 在 图 2-21 中 仅 有 两 个 业务 功能 提 到 了 这 个 
关键 成 功 因 素 ， 为 什么 ”需要 做 什么 工作 来 增强 这 张 图 以 使 得 更 多 的 实体 表示 出 业务 功能 与 这 
个 关键 成 功 因素 间 的 联系 ? 

项 目 练习 

1) 重新 安排 图 2-20 的 行 与 列 ， 以 使 其 中 的 项 目 按 对 角 线 排列 。 分 析 这 个 模式 ， 你 能 得 到 什 
么 结论 ? 

2) 重新 绘制 图 2-17 来 反映 医院 所 计划 的 未 来 扩建 与 增长 后 的 医院 结构 。 根 据 这 一 扩建 和 增 
长 计划 ， 图 2-18、 图 2-19 和 图 2-20 需 要 做 哪些 变动 ? 

3) 以 图 2-20 和 图 2-21 为 基础 ， 判 断 哪些 数据 实体 对 于 运作 成 本 控制 是 至 关 重 要 的 。 对 于 信 
息 系 统 的 开发 来 说 ， 这 一 结论 暗示 着 什么 ? 

4) 在 项 目 问题 5 中 ， 列 出 了 风险 管理 业务 功能 中 所 需要 的 附加 数据 实体 。 更 改 图 2-19 以 包 
括 这 些 附加 实体 和 所 有 数据 实体 之 间 的 有 关联 系 。 

5) 来 自 “ 给 病人 开 账 单 ” 业 务 功能 的 一 个 重要 输出 之 一 是 病人 的 账单 。 在 第 1 章 的 项 目 练 
习 2 中 介绍 了 账单 的 一 种 简化 版 本 ， 下 面 又 给 出 了 这 个 账单 。 第 1 章 的 项 目 练习 2 请 你 加 上 那些 
必须 出 现在 账单 上 的 且 漏 掉 的 数据 。 利 用 你 在 那个 练习 中 得 到 的 结论 ， 验 证 图 2-19 中 的 企业 数 
据 模 型 包含 了 产生 一 个 病人 账单 所 必需 的 数据 。 解 释 为 完成 验证 工作 你 必须 做 些 什么 ?从 分 析 
中 你 能 发 现 些 什 么 ? 


Patient Name: Dolan, Mark 
Patient Number: 
Patient Address: 


ltem Code ltem Description Amount 





6) 案例 研究 中 所 描述 的 研究 小 组 的 活动 与 早期 的 信息 系统 和 数据 库 的 开发 有 关 。 请 概述 楼 
下 来 要 采取 的 步骤 以 使 得 信息 系统 中 目前 的 系统 与 数据 库 和 将 来 医院 所 需要 的 信息 系统 有 机 联 
系 起 来 。 
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7) 风险 管理 领域 的 管理 者 希望 利用 计算 机 来 支持 他 的 活动 。 医 院 面临 越 来 越 多 的 有 关 玩忽 
职守 的 投诉 与 诉讼 ， 而 管理 者 不 相信 他 必须 等 到 信息 系统 与 数据 库 计 划 实 施 后 才能 改善 信息 服 
. 务 。 管 理 者 需要 的 是 一 个 追踪 投诉 、 法 律 诉讼 、 律 师 、 法 官 、 医 院 员 工 、 投 诉 赔偿 和 判决 的 系 
统 。 你 将 如 何 设法 解决 这 个 改善 信息 服务 的 要 求 ? 你 会 运用 什么 方法 来 设计 他 需要 的 系统 和 数 
据 库 ? 为 什么 ? 

8) 重新 考虑 项 目 练习 7 中 风险 管理 的 管理 者 的 要 求 。 他 所 需要 的 系统 与 数据 库 应 该 在 哪 一 
层 上 进行 开发 ? 为 什么 ? 
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概要 


数据 库 开 发 的 第 一 步 是 数据 库 分 析 ， 其 任务 是 确认 用 户 对 数据 的 需求 ， 并 开发 数据 模型 以 
表示 用 户 的 需求 。 概念 数据 模型 是 从 用 户 角度 描述 数据 的 模型 ， 与 实现 模型 所 使 用 的 技术 无 关 。 
第 二 部 分 深入 讲述 了 概念 数据 建 模 的 主流 方法 一 一 实体 -联系 模型 。 

业务 规则 是 组 织 中 有 关 业 务 处 理 的 原则 和 方法 的 统称 ， 数 据 库 开发 人 员 根据 业务 规则 进行 
概念 数据 建 模 。 在 第 3 章 的 开始 ， 介 绍 通过 描述 业务 规则 进行 建 模 的 观点 ， 说 明 良 好 的 业务 规 
则 应 该 符合 的 特征 并 讨论 总 结业 务 规则 的 过 程 。 在 业务 规则 的 讨论 中 ,会 涉及 数据 模型 中 数据 
元 素 命 名 和 定义 的 一 般 原 则 。 然 后 ， 该 章 介 绍 实体 -联系 模型 (E-R 模 型 ) 的 主要 特性 ， 包 括 
该 模型 中 实体 、 联 系 和 属性 的 表示 方法 和 这 些 建 模 技术 的 主要 结构 。 对 于 每 种 特定 的 结构 ， 该 
黄 相 应 地 给 出 命名 和 定义 模型 中 元 素 的 原则 。 该 章 会 讲述 强 、 弱 两 种 实体 类 型 的 区 别 和 如 何 确 
定 联系 类 型 。 该 章 讲 述 不 同类 型 的 属性 ， 如 简单 属性 与 复合 属性 ， 单 值 属性 与 多 值 属性 ， 导 出 
属性 和 标识 符 属性 等 。 该 章 还 讲述 联系 类 型 和 实例 的 区 别 与 联系 ， 并 介绍 关联 实体 的 概念 。 而 
目 还 讲述 一 元 、 二 元 和 三 元 等 不 同 度数 的 联系 。 该 章 还 介绍 出 现在 各 种 建 模 情况 下 联系 的 基数 。 
特别 地 ， 该 章 讨 论 为 与 时 间 有 关 的 数据 建 模 的 一 般 方法 。 最 后 ， 该 章 描述 实体 之 间 具 有 多 种 联 
系 的 情况 。 在 该 章 中 ， 以 松 谷 家 具 公 司 为 例 来 讲述 E-R 建 模 的 概念 。 

在 第 4 章 中 ， 讲 述 实 体 - 联 系 建 模 的 高 级 概念 ， 并 介绍 最 新 的 E-R 模 型 表示 法 ， 利 用 这 些 表 
示 法 能 够 找到 更 复杂 的 业务 规则 。 通 常 需 要 额外 的 建 模特 性 ， 以 应 付 当今 组 织 遇 到 的 日 益 复 杂 
的 业务 环境 。 

在 增强 型 实体 -联系 (EER ) 图 中 ， 最 重要 的 新 引入 的 建 模 结构 是 超 类 型 / 子 类 型 联系 。 这 
种 新 结构 允许 创建 一 种 通用 的 实体 类 型 ( 称 为 超 类 型 )， 并 将 超 类 型 划分 成 几 种 特殊 的 子 类 型 。 
例如 ， 赛 车 和 轿车 是 汽车 的 子 类 型 。 该 章 介绍 一 种 简单 的 表示 方法 来 表示 超 类 型 / 子 类 型 之 间 
的 联系 ， 并 介绍 概 化 和 特 化 这 两 种 方法 以 标识 超 类 型 / 子 类 型 联系 。 进 一 步 地 ， 该 章 还 介绍 进 
一 步 提 炼 基本 的 超 类 型 / 子 类 型 联系 的 表示 法 。 应 为 联系 编写 良好 的 说 明文 档 以 确保 其 可 理解 
性 ， 这 是 非常 重要 的 。 该 章 介绍 一 种 称 为 实体 聚焦 的 技术 ， 该 技术 能 够 简化 E-R 图 的 表示 以 满 
足 各 种 类 型 E-R 图 使 用 者 的 需要 。 

业务 规则 是 定义 或 约束 业务 的 某 些 方面 的 语句 。 本 章 对 常见 的 业务 规则 进行 分 类 ， 然 后 介 
绍 各 种 业务 规则 的 声明 方法 ， 并 引入 同时 可 用 于 EER 图 的 业务 规则 的 表示 方法 。 

使 用 面向 对 象 技术 开发 的 系统 中 所 使 用 的 是 另外 一 种 数据 建 模 的 表示 方法 一 一 UML 类 图 。 
这 些 内 容 将 在 第 五 部 分 的 第 14 章 进行 讲解 。 如 果 对 UML 和 E-R 图 比较 感 兴趣 ， 可 在 学 完 第 4 章 
后 直接 学 习 第 14 章 。 

在 第 二 部 分 的 两 章 中 讲述 概念 数据 建 模 ， 为 数据 库 分 析 和 设计 打下 坚实 的 基础 。 对 一 个 数 
据 库 分 析 员 来 说 ， 应 该 使 用 E-R 表 示 法 对 用 户 数据 和 信息 的 需求 进行 建 模 。 
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3.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

。 简 明定 义 以 下 列 关键 术语 : 业务 规则 、 术 语 、 事 实 、 实 体 -联系 模型 (E-R 模 型 )、 实 体 - 
联系 图 (E-R 图 )、 实 体 、 实 体 类 型 、 实 体 实例 、 强 实体 类 型 、 弱 实体 类 型 、 标 识 属 主 、 
标识 联系 、 属 性 、 复 合 属 性 、 简 单 属 性 、 多 值 属 性 、 导 出 属性 、 标 识 符 、 复 合 标识 各 
联系 类 型 、 联 系 实例 、 关 联 实体 、 联 系 的 度 、 一 元 联系 、 二 元 联系 、 三 元 联系 、 基 数 约 
束 、 最 小 /最 大 基数 和 时 间 戳 。 | 

* 说 明 为 什么 系统 大 多 数 开发 人 员 相 信和 数据 建 模 是 系统 开发 过 程 中 最 重要 的 部 分 。 

* 规范 地 命名 和 定义 实体 、 联 系 和 属性 。 

“ 区别 一 元 、 二 元 和 二 元 联系 ， 并 分 别 给 出 一 个 常见 的 例子 。 

“建立 E-R 图 中 以 下 结构 的 模型 : 复合 属性 、 多 值 属 性 、 导 出 属性 、 关 联 实体 、 标 识 联 系 ， 
以 及 最 小 /最 大 基数 约束 。 

* 绘制 表示 常见 业务 情况 的 E-R 图 。 

“将 一 个 多 对 多 的 联系 转换 为 关联 实体 类 型 。 

“在 E-R 图 中 应 用 时 间 截 建 模 简 单 的 与 时 间 相关 的 数据 。 


3.2 引言 


本 书 前 两 章 通过 简单 的 例子 介绍 了 数据 建 模 和 E-R 模 型 。 业 务 规则 是 描述 业务 活动 的 有 力 
工具 ， 本 章 将 基于 业务 规则 的 概念 形式 化 数据 模型 ， 并 进一步 详细 描述 E-R 模 型 。 

业务 规则 来 源 于 政策 、 过 程 、 事 件 、 功 能 和 其 他 业务 对 象 ， 以 及 在 组 织 中 声明 的 约束 。 业 
务 规则 对 于 数据 建 模 来 说 是 十 分 重要 的 ， 它 们 决定 了 如 何 处 理 和 存储 数据 。 基 本 的 业务 规则 就 
是 数据 名 和 数据 定义 。 为 了 在 业务 中 准确 地 命名 和 定义 数据 对 象 ， 本 章 给 出 一 些 基本 的 指导 原 
则 。 根 据 数据 的 概念 模型 的 要 求 ， 必 须 命名 和 定义 实体 类 型 、 属 性 和 联系 。 其 他 的 业务 规则 可 
以 在 这 些 数据 对 象 上 声明 约束 。 通 过 对 数据 模型 进行 研究 ， 可 以 发 现 这 些 约束 ， 例 如 ， 在 实 
体 -联系 图 和 相应 的 文档 中 都 可 以 发 现 这 些 约束 。 

在 应 用 多 年 之 后 ，E-R 模 型 仍然 是 概念 数据 建 模 的 主流 方法 。 它 得 到 广泛 使 用 的 原因 如 下 : 
使 用 起 来 相对 容易 ， 具 有 广泛 的 CASE 工 具 支 持 ， 以 及 人 们 认为 实体 和 联系 是 现实 世界 中 的 自 
然 建 模 概 念 。 

E-R 模 型 经 常 作为 一 种 交流 的 工具 ， 用 来 在 数据 库 开发 过 程 的 分 析 阶 段 沟通 数据 库 设计 者 
和 终端 用 户 ( 详 见 第 2 章 )。E-R 模 型 建立 了 一 种 概念 数据 模型 ， 它 表示 的 是 独立 于 具体 软件 
(如 数据 库 管理 系统 ) 的 数据 库 结 构 和 约束 ， 以 及 相关 的 数据 模型 。 数 据 库 的 实现 将 基于 这 些 
模型 。 

当 讨 论 E-R 建 模 时 ， 一 些 作 者 会 介绍 关系 数据 模型 所 特有 的 术语 和 概念 。 特 别 地 ， 他 们 建 
议 通 过 完全 解析 主键 和 外 键 来 实现 模型 的 完全 规范 化 。 但 是 ， 在 现 有 的 关系 数据 模型 理论 中 ， 
这 种 完全 的 规范 化 方法 还 很 不 成 熟 。 在 目前 的 数据 库 环 境 中 ,数据库 可 以 用 面向 对 象 技术 和 面 


第 3 草 ”组织 中 的 烧 据 建 模 69 








向 对 象 以 及 对 象 关系 技术 的 混合 来 实现 。 因 此 ， 我 们 将 规范 化 的 概念 推 壕 至 第 5 章 再 讨论 。 

实体 -联系 模型 是 在 CHEN 所 著 的 一 篇 关键 性 的 文章 (1976) 引入 的 。 在 文章 中 ， 他 描述 
了 实体 =~ 联系 模型 的 主要 结构 实体 和 联系 一 一 以 及 相关 的 属性 。 后 来 ，CHEN 和 其 他 人 又 
通过 增加 额外 的 结构 对 这 个 模型 进行 扩展 ， 见 Teorey、Yang 和 Fry(1986) 以 及 Storey(1991) 的 论 
文 。E-R 模 型 继续 发 展 ， 但 由 于 种 种 原因 ， 至 今 E-R 模 型 的 表示 方法 还 没有 进行 标准 化 。Song、 
Evans 和 Park (1995) 的 著作 对 10 种 E-R 建 模 表示 方法 进行 了 两 两 对 比 ， 并 解释 每 种 方法 体系 的 
主要 优点 和 缺点 。 

许多 系统 开发 人 员 认 为 数据 建 模 是 系统 开发 过 程 中 最 重要 的 环节 ， 这 种 认识 来 源 于 以 下 三 
个 重要 原因 (Hoffer、George 和 Valacich，2002): 

1) 在 设计 数据 库 、 程 序 以 及 其 他 系统 组 成 部 分 的 过 程 中 ， 通 过 数据 建 模 发 现 数据 的 特征 是 
极为 关键 的 。 同 时 ， 在 信息 系统 中 通过 数据 建 模 ， 还 可 以 发 现 一 些 业 务 中 的 事实 和 规则 ， 而 这 
些 事实 和 规则 对 于 保证 信息 系统 的 数据 完整 性 是 非常 重要 的 。 

2) 在 许多 现代 的 信息 系统 中 ， 数 据 比 过 程 更 复杂 ， 所 以 在 构建 系统 需求 时 ， 数 据 自然 而 然 
地 成 为 核心 因素 。 通 常 ， 研 究 数 据 结构 的 目的 在 于 提供 丰富 的 数据 源 ， 以 支持 系统 中 的 各 类 查 
询 、 分 析 和 汇总 。 

3) 与 使 用 数据 的 业务 过 程 相 比 ， 数 据 更 加 稳定 。 因 此 ， 基 于 面向 数据 的 信息 系统 设计 开发 
比 基 于 面向 过 程 的 信息 系统 具有 更 长 的 使 用 寿命 。 

本 章 通过 常见 的 符号 和 规定 ， 描 述 E-R 建 模 的 主要 特征 。 本 章 首先 给 出 E-R 模 型 中 的 基本 
结构 一 一 实体 、 属 性 和 联系 一 一 的 定义 ; 随后 定义 E-R 建 模 中 常见 的 三 种 类 型 的 实体 : 强 实体 、 
器 实体 和 关联 实体 ; 同时 还 定义 多 种 重要 的 属性 ， 包 括 单 值 /多 值 属 性 ， 导 出 属性 和 复合 属性 
等 。 然 后 ,本章 介 绍 与 联系 有 关 的 三 个 重要 概念 : 联系 的 度 、 联 系 的 基数 和 联系 中 的 参与 约束 。 
最 后 ， 本 章 给 出 松 谷 家 有 具 公司 的 E-R 图 的 扩展 示例 。 


3.3 根据 组 织 中 的 规则 建立 数据 模型 


在 本 章 和 下 一 章 中 ， 将 说 明 如 何 用 数据 模型 (特别 是 实体 -联系 符号 ) 表示 组 织 中 的 规则 
与 制度 。 事 实 上 ， 数 据 建 模 的 全 部 作用 就 是 研究 使 用 数据 的 组 织 的 规则 和 制度 。 在 信息 处 理 和 
存储 系统 中 ， 业 务 规则 和 制度 控制 着 数据 的 创建 、 更 新 和 移 除 ， 因 此 ， 在 描述 数据 的 同时 必须 
描述 与 之 相关 的 业务 规则 。 例 如 ， 有 这 样 一 条 政策 规定 “每 个 在 校 大 学 生 必 须 有 一 位 导师 ”， 
这 条 政策 规定 强制 性 地 将 数据 库 中 记录 的 每 个 大 学 生 的 数据 与 某 个 指导 教师 的 数据 关联 起 来 。 
再 看 下 面 这 条 语句 : “大 学 生 是 这 样 一 类 人 ， 他 们 的 和 人 学 申请 被 接受 ， 或 者 已 经 接受 大 学 中 的 
某 些 课程 的 教育 或 培训 ， 无 论 这 些 课程 或 培训 记 和 人 学 分 与 否 "， 这 句 话 不 但 定义 “大 学 生 ” 这 
个 概念 ， 而 且 还 说 明 大 学 的 一 项 规定 (这 项 规定 隐 含 表示 : 校友 是 大 学 生 ; 而 如 果 认为 大 学 教 
育 展览 不 是 学 校 所 开展 的 培训 项 目 ， 那 么 参加 大 学 教育 展览 但 入 学 申请 没有 被 接受 的 中 学 生 不 
属于 大 学 生 的 范畴 ) 。 

业务 规则 和 制度 不 是 通用 的 。 不 同 的 大 学 会 用 不 同 的 制度 指导 学 生 ， 对 学 生 的 定义 也 有 所 
不 同 。 一 个 组 织 的 规则 和 和 制度 可 能 随 着 时 间 发 生变 化 一般 比较 缓慢 )。 例 如 ， 学 校 会 规定 在 
学 生 没 有 选择 专业 以 前 不 需要 指导 教师 。 

数据 库 分 析 员 的 任务 如 下 : 

* 确认 并 理解 管理 数据 的 规则 。 

* 对 规则 进行 描述 ， 使 信息 系统 开发 人 员 和 用 户 可 以 准确 地 理解 这 些 规则 。 

* 用 数据 库 技术 实现 这 些 规则 。 
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数据 建 模 在 这 个 过 程 中 起 着 重要 的 作用 。 数 据 建 模 的 目的 是 将 与 数据 有 关 的 业务 规则 记录 
下 来 ， 本章 在 简要 叙述 一 般 的 业务 规则 的 基础 上 ， 讨 论 数据 建 模 和 实体 -联系 模型 的 表示 方法 。 
数据 模型 不 可 能 表示 所 有 的 业务 规则 (也 设 必 要 全 部 表示 ， 因 为 并 非 所 有 的 业务 规 财 都 要 管理 
数据 )， 数 据 模 型 应 该 与 相关 的 文档 和 其 他 信息 系统 模型 (例如 ， 记 录 数 据 处 理 的 模型 ) 相 结 
合 ， 才 能 完整 地 描述 信息 系统 的 业务 规则 。 

3.3.1 业务 规则 概述 

业务 规则 (business rule) 是 “一 种 定义 或 约束 业务 中 的 某 些 有 关 方 面 的 语句 ， 主 要 说 明 
业务 的 结构 以 及 控制 或 影响 业务 的 行为 …… 防止 、 导 致 或 引发 某 些 事件 发 生 的 规则 等 ” 
(GUIDE Business Rules Project，1997)。 例 如 ， 以 下 两 条 语句 就 是 业务 规则 的 常见 表示 形式 ， 
它们 描述 影响 数据 处 理 和 存储 的 业务 规则 : 

。“ 仪 当 学 生成 功 完成 某 门 课程 的 预备 课程 后 ， 才 可 以 注册 某 个 班级 选修 该 课程 "。 

。 “顾客 如 果 结 清 余 款 ， 可 享受 10% 的 折扣 ”。 

在 今天 的 大 多 数组 织 中 ， 存 在 着 无 数 条 这 样 的 规则 。 这 些 规则 在 总 体 上 影响 着 组 织 的 行为 
方式 ， 并 决定 着 组 织 对 外 界 环境 的 反应 方式 (Gottesdiener，1997 )。 在 组 织 中 发 据 和 记录 业务 规 
则 是 一 项 重要 而 复杂 的 工作 。 首 先 必须 对 业务 规则 进行 金 面 整理 、 然 后 应 用 数据 库 技术 在 信息 
系统 中 进行 实现 ， 才 能 确保 信息 系统 正常 工作 ， 以 及 用 户 对 其 输入 和 看 到 的 信息 有 正确 的 理解 。 

业务 规则 范 型 

"业务 规则 的 概念 已 经 在 信息 系统 中 广泛 应 用 , 但 是 , 在 提 到 类 似 的 规则 时 ,“ 完 整 性 约束 ” 

这 个 术语 更 为 常见 (特别 是 在 数据 库 中 )。 然 而 ， 这 个 术语 的 使 用 范围 是 有 限制 的 ， 它 一 

般 用 来 指 维护 数据 库 中 数据 值 和 联系 的 合法 性 。 

术语 “业务 规则 ”具有 更 广 的 使 用 范围 ， 它 包括 所 有 组 织 中 对 数据 库 有 影响 的 规则 (如 上 
两 个 例子 所 示 )。 事 实 上 ， 一 些 研究 人 员 建 议 用 一 种 新 的 范 型 来 表示 业务 规则 ， 这 样 可 以 更 准 
确 地 分 析 信 息 系 统 的 需求 (von Halle，1997)。 这 种 方法 基于 以 下 前 提 : 

* 因为 业务 规则 表示 的 是 企业 中 各 种 制度 以 及 这 些 制度 如 何 指 导 个 人 和 集体 的 行为 ， 所 以 

业务 规则 是 企业 的 核心 概念 。 具 有 良好 结构 的 业务 规则 可 以 采用 自然 语言 的 形式 展示 给 

最 终 用 户 ， 或 采用 数据 模型 的 形式 展示 给 系统 开发 人 员 。 

“业务 规则 应 用 最 终 用 户 所 熟悉 的 形式 进行 表达 ， 这 样 ， 最 终 用 户 也 可 以 定义 并 维护 他 们 ] 

自己 的 业务 规则 。 

* 业务 规则 应 该 具有 良好 的 可 维护 性 。 业 务 规则 应 该 存储 在 中 心 信息 库 中 ， 每 条 规则 只 能 

表达 一 次 ， 并 可 在 整个 组 织 中 共享 。 

“业务 规则 可 以 通过 软件 来 自动 应 用 ， 这 些 软件 可 以 解释 这 些 规则 ， 并 利用 数据 库 管理 系 

统 的 完整 性 机 制 强制 应 用 这 些 规 则 。 

尽管 已 经 取得 很 多 进步 ， 但 业界 完全 实现 上 述 目标 尚 需 时 日 。 进 一 步 的 研究 和 工具 的 开发 
仍 在 继续 (特别 是 在 业务 规则 的 自动 执行 方面 )， 而 且 研究 人 员 对 业务 规则 方法 寄予 厚望 。 这 
种 方法 最 大 的 法 在 优势 是 “业务 规则 具有 极 好 的 可 维护 性 ”"。 业 务 规则 在 两 方面 具有 很 强 的 能 
力 ， 其 一 是 能 够 将 信息 系统 中 的 需求 作为 业务 规则 的 集合 进行 细 化 和 维护 ， 其 二 是 能 够 从 一 个 
业务 规则 的 信息 库 中 自动 生成 信息 系统 。 系 统 的 自动 生成 和 维护 不 但 可 以 简化 系统 开发 过 程 ， 
而 且 可 以 提高 所 开发 系统 的 质量 。 

3.3.2 确定 业务 规则 的 范围 

在 本 章 和 下 一 章 中 ， 本 书 只 关注 那些 对 组 织 的 数据 库 产生 影响 的 业务 规则 。 大 多 数组 织 有 

许多 与 数据 库 无 关 的 规则 或 制度 。 例 如 , “员工 在 周 五 可 以 随便 着 装 ” 是 一 条 很 重要 的 规定 ， 
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但 它 对 数据 库 没 有 直接 的 影响 。 另 一 方面 ,“ 学 生 只 有 成 功 学 完 某 门 课程 的 预备 课程 ， 才 可 以 
申请 注册 某 个 班级 选修 该 课程 ”这 条 规则 属于 本 书 所 考虑 的 范围 ， 因 为 该 规则 在 数据 库 的 事务 
处 理 中 起 约束 作用 。 如 果 试 图 注册 一 个 没有 完成 预备 课程 的 学 生 ， 在 该 规则 的 作用 下 ， 将 拒绝 
执行 这 项 事务 。 一 些 业 务 规则 不 能 由 一 般 的 数据 模型 符号 表示 。 自 然 语言 也 可 以 作为 一 种 表示 
形式 ， 它 可 以 描述 这 些 不 能 用 各 种 实体 -联系 图 表示 的 业务 规则 ， 其 中 一 些 业务 规则 也 可 以 用 
关系 数据 模型 表示 、 在 第 5 章 中 将 详细 描述 这 些 问 题 。 

1. 良好 的 业务 规则 

无 论 是 用 自然 语言 表述 ， 还 是 用 结构 化 数据 模型 表示 ， 或 者 用 其 他 信息 系统 文档 表示 ， 如 
果 规 则 符合 如 上 所 述 的 前 提 条 件 ， 则 业务 规则 将 具有 一 些 共同 的 特征 。 在 表 3-1 中 总 结 了 这 些 
特征 。 如 果 业 务 规则 由 业务 人 员 (而 不 是 技术 人 员 ) 定义 、 批 准 和 管理 ， 那 么 上 述 这 些 特征 更 
容易 满足 。 业 务 人 员 会 主动 监督 业务 规则 的 执行 。 数 据 库 分 析 员 的 职责 就 是 帮助 找到 规则 ， 并 
且 将 表述 有 误 的 规则 转化 为 满足 所 需 特征 的 规则 。 

表 3-1 良好 业务 规则 的 特征 





特征 解 释 

声明 性 -个 业务 规则 应 该 是 制度 内 容 的 诸多. 而 不 是 描述 制度 如 何 执行 或 监督 制度 ; 规则 不 是 在 描 
述 过 程 或 实现 ， 而 是 在 描述 过 程 所 验证 的 内 容 

准确 性 规则 的 含义 应 该 清晰 ， 在 某 一 组 织 内 ， 其 解释 是 惟一 的 

原子 性 “项 业务 规则 只 包含 一 项 陈述 ， 而 不 是 包含 几 项 陈述 ;业务 规则 的 任何 部 分 都 不 能 作为 -一 
个 新 的 、 完 整 的 规则 ( 即 规则 是 不 可 分 的 ， 但 却 是 充分 的 ) 

-生性 业务 规则 应 该 具有 内 部 的 -至 性 ， 即 不 包含 相 瓦 冲突 的 语句 ; 并 且 和 其 他 规则 保持 一 焉 性 

可 表述 性 业务 规则 必须 能 够 用 自然 语言 描述 ， 但 是 业务 规则 应 使 用 结构 化 的 白 然 语 言 描 述 ， 以 使 不 会 
产 牛 歧义 

可 区 分 业务 规则 不 包含 匈 余 信息 、 但 某 个 业务 规则 本 引用 其 他 的 规则 (特别 是 引用 定义 ) 

商 疝 业务 业务 规则 应 使 用 业务 人 员 能 够 理解 的 术语 来 表述 。 由 于 业务 规则 是 业务 制度 的 陈述 ， 所 以 仅 


有 业务 人 员 才 能 修改 或 废除 一 项 规则 。 这 就 是 说 ， 业 务 规则 是 属于 业务 的 


注 : 改编 自 Gottesdiener (1999) 和 Piotkin (1999 ) 。 


作为 数据 库 分 析 员 ， 应 对 不 合 规范 的 业务 规则 进行 修改 ， 以 满足 上 述 特征 。 

2. 收集 业务 规则 

业务 规则 根据 组 织 的 职能 、 事 件 、 制 度 、 单 位 、 风 险 承担 者 和 其 他 业务 对 象 来 描述 。 为 了 
确认 这 些 业务 规则 , 应 该 参与 有 关 的 信息 系统 需求 收集 讨论 会 ,阅读 组 织 的 文档 (如 人 员 和 手册 、 
公司 制度 、 合 同 、 营 销 手册 和 技术 指导 等 ) 以 及 接触 其 他 信息 资源 ， 最 后 整理 成 业务 规则 。 常 
用 的 确定 业务 规则 的 方法 是 提出 并 回答 这 样 六 个 问题 : 何人 ( Who)、 何 事 (What)、 何 时 
(When)、 何 地 (Where) 以 及 如 何 操作 (How )。 业 务 规则 的 最 初 陈述 一 般 是 模糊 的 、 不 准确 
的 ， 有 人 称 之 为 业务 泛 谈 ， 数 据 分 析 员 必须 坚持 汪清 关于 业务 规则 的 这 些 初始 陈述 。 通 过 反复 
的 咨询 和 整理 ， 形 成 简洁 明确 的 业务 规则 。 在 本 章 及 后 面 几 章 中 ， 我 们 会 引入 以 下 问题 供 数据 
分 析 员 进行 业务 规则 的 检查 ， 这 些 问 题 可 适应 各 种 数据 建 模 的 情况 。 这 些 问题 包括 : “这 种 情 
况 是 否 总 是 存在 ，“ 是 否 存在 导致 其 他 事件 发 生 的 特殊 环境 *,“ 是 否 存在 不 同 于 那个 人 的 人 ”， 
是 仅 有 一 个 还 是 有 多 个 ",“ 是 需要 保持 历史 记录 ， 还 是 当前 数据 足以 说 明 问题 ”。 
3.3.3 数据 命名 与 定义 

命名 和 定义 数据 对 象 是 理解 数据 结构 以 及 进行 数据 建 模 的 基础 。 数 据 对 象 必须 首先 命名 和 
定义 ， 然 后 才能 意义 明确 地 用 于 组 织 的 数据 模型 。 在 实体 -联系 模型 的 表示 方法 中 ， 必 须 明 确 
命名 和 定义 每 个 实体 、 联 系 和 属性 。 





1. 数据 命名 

在 开发 实体 -联系 数据 模型 时 ， 我 们 会 特别 强调 实体 、 联 系 和 属性 的 命名 ， 但 是 要 理解 命 
名 数据 对 象 的 一 些 常 用 原则 。 

。 与 业务 相关 ， 与 具体 的 软 硬 件 技术 无 关 。 例 如 ，Customer (顾客 ) 是 一 个 好 的 数据 对 象 

名 ， 但 File10、Bit7 或 PayrollReportSortKey 不 是 好 的 名 字 。 

。 命 名 应 具有 实际 意义 。 命 名 本 身 也 是 数据 对 象 说 明文 档 的 一 部 分 ， 即 命名 精炼 地 体现 出 
数据 对 象 的 本 质 。 所 以， 命名 应 尽量 如 免 使 用 过 于 一 般 化 的 词汇 ， 如 “has”、“is”、 
“person” 或 者 “it”。 

。 命 名 必须 是 惟一 的 ， 以 区 别 于 其 他 数据 对 象 。 在 数据 名 中 应 包含 能 够 与 其 他 类 似 数 据 对 
象 相 区 别 的 词汇 (如 HomeAddress (家庭 地 址 ) 和 CampusAddress (校园 地 址 ) ) 。 

“可 读 性 强 。 命 名 的 结构 应 和 概念 的 自然 表达 方式 相 一 致 (如 GradePointAverage (班级 平 
均 分 ) 是 一 个 好 的 数据 名 ， 而 AverageGradeRelativeToA (与 A 班级 有 关 的 平均 分 ) 这 个 
名 字 虽 然 精 确 ， 但 却 显 得 过 于 宛 长 )。 

。 由 一 个 得 到 认可 的 词汇 表 中 的 词汇 组 成 。 每 个 组 织 通常 选择 一 些 含义 恰当 的 词汇 来 命名 
数据 ， 如 最 好 使 用 maximum (最 大 值 )， 而 不 是 upper limit (上 限 )、ceiling (最 高 限度 ) 
或 highest (最 高 ) 等 词汇 。 另 外 ， 数 据 的 别名 也 应 包含 在 数据 库 的 文档 中 。 用 作 数 据 名 
的 词汇 也 可 以 是 缩 略 形式 ， 如 用 CUST 表 示 Customer。 在 数据 名 长 度 受 限 制 时 ， 尽 量 使 用 
缩 略 语 。 

“可 重用 。 不 同 的 人 或 者 同一 个 人 在 不 同 的 时 间 可 能 会 不 约 而 同 地 使 用 同样 或 相似 的 数据 
名 ， 这 说 明 存在 一 种 被 人 们 认可 的 命名 习惯 ， 在 命名 数据 时 应 尽量 遵守 这 种 习惯 。 如 学 
生 的 生日 被 命名 为 StudentBirthDate， 而 员工 的 生日 被 命名 为 EmployeeBirthDate 等 。 

Salin (1990) 建议 采取 以 下 命名 方法 。 

1) 给 出 一 个 数据 的 大 体 上 的 定义 (定义 将 在 随后 讨论 )。 

2) 去 掉 不 重要 和 不 合法 的 词汇 (大 家 认为 不 适合 作为 名 字 的 词 )。 注 意 ， 在 定义 中 出 现 
AND 和 OR 意味 着 其 中 可 能 包括 两 个 或 多 个 数据 对 象 。 如 果 可 以 的 话 ， 应 该 分 离 这 些 数 据 对 象 ， 
并 给 每 个 对 象 分 配 不 同 的 名 称 。 

3) 将 词汇 按照 含义 明生、 可 重用 的 形式 组 织 。 

4) 给 出 每 个 词汇 的 标准 缩 略 形式 。 

5) 确认 数据 名 是 否 已 经 存在 ， 如 果 是 ， 则 需 加 上 其 他 的 标识 性 词汇 ， 以 确保 数据 命名 的 惟 
一 性 。 

在 本 章 的 数据 库 开 发 实例 中 所 使 用 的 数据 名 都 可 以 作为 好 的 数据 命名 的 范例 。 

2. 数据 定义 | 

定义 (有 时 称 为 结构 化 断言 ) 可 以 看 做 是 一 种 业务 规则 (GUIDE Business Rules Project， 
1997)， 定 义 是 术语 或 事实 的 解释 。 术 语 (term) 是 在 业务 中 有 特定 含义 的 词 或 短语 ， 如 课程 、 
班级 、 租 用 车 辆 、 航 班 、 预 约 以 及 乘客 等 。 术 语 经 常 可 作为 构成 数据 名 的 关键 字 。 术 语 的 定义 
必须 谨慎 、 简 练 。 一 些 常 见 的 名 词 ， 如 “day”、“month”、“person” 或 者 “television”， 因为 
不 会 产生 歧义 ， 所 以 不 必定 义 为 术语 。 

事实 (fact) 是 两 个 或 多 个 术语 之 间 的 关联 。 以 下 是 定义 为 事实 的 例子 (已 定义 的 术语 用 
下 划 线 表示 )。 

*“ 课 程 是 某 个 特定 领域 的 一 个 讲授 单元 "。 这 个 定义 将 术语 “特定 领域 ”和 “讲授 单元 ” 

联系 在 一 起 。 假 设 这 些 术语 是 很 常见 的 ， 不 需要 进一步 定义 。 
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。 “顾客 可 能 在 特定 的 日 期 在 租车 行 租赁 一 辆 特定 款式 的 轿车 ”"。 这 个 事实 定义 了 租赁 请 求 
模型 ， 其 中 将 四 个 术语 (以 下 划 线 表示 ) 关联 在 一 起 (GUIDE Business Rules Project， 
1997)。 其 中 三 个 术语 都 与 特定 的 业务 有 关 ， 应 该 单独 定义 〈 日 期 是 个 常见 词汇 ) 。 

3. 良好 的 数据 定义 

在 本 章 和 下 一 章 的 实体 -联系 表示 法 设计 中 ， 读 者 可 以 看 到 良好 的 定义 方式 ， 包 括 实 体 、 
联系 和 属性 等 。 下 面 给 出 几 条 一 般 性 的 原则 (Aranow，1989 ) 。 

。 所 有 的 数据 定义 和 各 类 业务 规则 都 来 源 于 信息 系统 的 需求 分 析 。 在 信息 系统 需求 分 析 的 

研究 过 程 中 ， 系 统 和 数据 分 析 员 应 寻找 数据 对 象 并 给 出 定义 。 

“定义 一 般 伴 随 图 形 说 明 ， 如 实体 - 联系 图 。 定 义 不 必 重复 已 在 图 中 显示 的 内 容 ， 而 是 对 

图 形 进 行 补 充 。 定 义 应 就 以 下 方面 描述 数据 对 象 特 征 : 

。 细 微 之 处 内 涵 清 晰 。 

。 特 殊 和 例外 条 件 。 

“实例 。 

* 何 处 、 何 时 以 及 如 何在 组 织 中 创建 或 计算 数据 。 

* 数据 是 静态 的 ， 还 是 可 以 随时 间 变 化 的 。 

。 数 据 的 原子 形式 是 单数 还 是 复数 。 

。 谁 确定 数据 值 。 

。 淮 拥有 数据 ， 即 谁 控 制 数据 的 定义 和 使 用 。 

“数据 是 否 可 选 ， 以 及 是 否 人 允许 空 值 ( 即 我 们 所 说 的 null 值 )。 

“ 该 数据 是 否 可 以 分 解 为 若干 个 原子 部 分 ， 或 它 是 否 常 与 其 他 数据 合并 成 更 复杂 的 复合 形 

式 或 聚合 形式 。 

如 果 在 数据 定义 中 没有 包括 以 上 所 有 特征 ， 则 这 些 特征 应 和 其 他 元 数据 存储 在 同一 文档 中 。 

* 数据 对 象 必须 先 命名 和 定义 ， 并 检查 是 否 与 其 他 数据 对 象 没 有 冲突 ， 确 认 后 才能 加 入 至 

数据 模型 ， 如 实体 -联系 模型 中 。 但 是 ， 数 据 模型 的 设计 过 程 也 是 一 个 对 数据 含义 理解 

不 断 深 入 的 过 程 ， 是 一 个 选 代 的 过 程 ， 所 以 一 旦 将 数据 对 象 置 人 实体 -联系 图 中 ， 就 希 

望 定义 不 再 发 生 改 动 。 

在 数据 建 模 中 有 一 种 说 法 ， 它 体现 了 和 良好 的 数据 定义 的 重要 性 : “掌握 数据 的 含义 ， 就 掌 
担 了 数据 "。 在 一 个 组 织 中 ， 同 时 定义 所 有 的 术语 和 事实 看 起 来 是 一 件 比较 容易 的 事 。 但 事实 
并 非 如 此 ， 事 实 上 这 可 能 是 数据 建 模 中 最 困难 的 问题 。 在 一 个 组 织 中 ， 对 一 些 常见 术语 下 多 个 
定义 的 情况 是 不 常见 的 ， 如 “customer” 和 “order” 等 术语 均 只 4 有 一 个 明确 的 定义 。 

_ 为 这 划 在 设计 定义 时 所 遇 到 的 问题， 的 人 den (学 后) 数据 对 象 、 Student 的 


一 个 学 生 ， 与 学 校 之 则 的 联系 经 历 如 下 阶段， 

1) 填报 志愿 : 通过 一 些 正式 的 手续 确定 感 兴趣 的 学 校 。 

2) 申请 人 : 申请 人 学 。 

3) 被 大 学 接受 的 申请 人 : 获准 入学， 学 生 接受 的 教育 可 以 是 学 位 教育 ， 也 可 以 是 其 他 方式 
的 教育 。 

4) 被 录取 的 学 生 : 至 少 注册 一 门 课程 。 

5) 继续 学 业 : 注册 参加 其 他 课程 的 学 习 ( 没 有 实质 性 区 别 )。 

6) 留级 生 : 在 规定 时 间 没 有 注册 有 关 的 课程 ， 重 新 申请 。 

7) 毕业 生 : 完成 所 有 的 学 习 过 程 ， 可 以 申请 学 位 ， 也 可 以 重新 申请 新 的 学 位 。 








可 以 设想 ， 在 这 种 情况 下 ， 给 出 一 个 得 到 所 有 人 一 致 认 可 的 定义 很 困难 的 。 有 一 些 可 供 选 
择 的 定义 方法 : 

1) 对 不 同 的 情况 给 出 不 同 的 定义 。 但 是 ， 若 只 有 一 个 实体 类 型 , 则 尽量 不 要 使 用 这 种 方法 ， 
因为 多 个 定义 并 不 是 好 的 定义 ， 而 且 会 产生 较 大 的 歧义 。 可 以 针对 上 述 每 一 种 学 后 的 情况 创建 
多 种 实体 类 型 ， 但 这 样 这 些 实体 之 间 的 区 别 就 会 很 小 ， 容 易 产 生 混 请 ， 则 时 数据 模型 中 的 结构 
也 将 会 很 复杂 。 

2) 使 用 一 个 尽 可 能 通用 的 定义 涵盖 大 部 分 情况 。 使 用 这 种 方法 时 , 必须 在 每 种 具体 情况 下 ， 
洪 加 说 明 特 别 情况 的 数据 。 例如 ,为 了 定义 学 生 ， 必 须 增加 与 学 生 情 况 有 关 的 数据 ， 如 报考 人 、 
申请 人 等 。 但 是 ,如果 一 个 学 生 同 时 出 现 多 种 状态 ， 如 可 以 在 学 习 一 门 专业 时 报考 另 一 门 专业 ， 
则 这 种 方法 也 不 适用 。 。 

3) 使 用 多 个 有 联系 的 数据 对 象 来 表示 Student。 例如 ,可 以 创建 一 个 Student 的 一 般 实体 类 型 ， 
然后 在 每 种 情况 下 加 入 相应 的 特征 以 表示 特定 的 学 生 实体 类 型 。 在 第 4 章 中 将 介绍 这 种 方法 。 


3.4 E-R 模 型 


实体 -联系 模型 (E-R 模 型 ) 是 组 织 或 业务 领域 中 数据 的 详细 的 、 合 平 逻 辑 的 表示 方法 。 
E-R 借 型 的 表述 基于 业务 环境 中 的 实体 ， 实 体 之 间 的 联系 (或 关联 ) 以 及 实体 与 联系 的 属性 
(或 性 质 )。BE-R 模 型 通常 以 实体 -联系 图 (E-R 图 ) 的 形式 描述 ，E-R 图 是 E-R 模 型 的 图 形 化 表 
To 
3.4.1 E-R 图 示例 

图 3-1 是 一 个 简单 的 E-R 图 ， 这 个 例子 有 助 于 初步 理解 E-R 图 。 该 图 表示 一 个 小 型 的 家 具 制 
造 公司 一 一 松 谷 家 具 公司 。 这 个 公司 从 不 同 的 供 货 商 处 采购 标准 件 ， 这 些 供 货 商 将 这 些 标准 件 


造 公 硬 





行 关于 所 订购 产品 的 说 明 。 

图 3-1 中 的 E-R 图 显示 有 关 这 个 公司 的 实体 和 联系 (为 简化 该 图 ， 隐 去 了 属性 )。 实 体 用 和 矩 
形 框 表示 ， 实 体 间 的 联系 用 矩形 框 之 间 的 攻 形 表示 ， 并 通过 线 与 有 关 的 实体 相连 接 。 图 3-1 中 
的 实体 有 : 

“CUSTOMER (顾客 ): 订购 或 可 能 订购 产品 的 组 织 或 个 人 。 例 如 ，L.L .Fish 家 具 公 司 。 

* PRODUCT (产品 ): 由 松 谷 家 具 公司 制造 的 多 个 品种 的 家 具 ， 以 供 顾客 订购 。 在 此 ， 产 
品类 型 用 产品 编号 表示 ， 而 不 是 具体 的 产品 。 例 如 ， 一 个 6 英尺 高 的 5 层 橡木 书架 的 产品 
编号 是 0600， 我 们 称 之 为 产品 0600。 

"ORDER (订购 ) 这 个 事务 将 一 或 多 个 产品 的 销售 与 顾客 相关 联 ， 并 在 销售 记录 或 会 计 
账目 中 用 一 个 事务 号 表示 。 例 如 ， 在 2001 年 9 月 10 日 ，L.L.Fish 购买 一 个 0600 产 品 和 四 个 
0623 产 品 的 事件 就 是 一 个 ORDER , 

“ITEM( 标 准 件 )， 用 于 组 装 产品 的 某 种 部 零件 。 它 可 由 一 或 多 个 供 货 商 提供 。 同 样 使 用 纺 
号 来 表示 部 零件 。 例 如 ，4 英 寸 的 球形 轴承 轮 脚 的 编号 是 [-27-4375。 

“SUPPLIER ( 供 货 商 ): 给 松 谷 家 具 公司 提供 标准 件 的 其 他 公司 。 例 如 ，Sure Fasteners 有 
限 公 司 。 

"SHIPMENT (装运 )， 装运 是 一 项 与 松 谷 家 具 公司 接收 标准 件 有 关 的 事务 。 来 自 一 个 供 货 
商 的 一 次 装运 的 所 有 标准 件 都 出 现在 一 张 送 货 单 上 。 例 如 ， 接 收 从 Sure Fasteners 有 限 公 
司 的 300 件 I-27-4375 标 准 件 和 200 件 I-27-4380。 

注意 ， 必 须 准确 地 定义 作为 元 数据 的 每 个 实体 。 例 如 ， 了 解 到 CUSTOMER 实 体 (无 论 是 
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组 织 还 是 个 人 ) 还 没有 从 松 谷 家 具 公 司 购买 产品 是 一 条 重要 的 信息 。 一 个 组 织 中 的 不 同 部 门 对 
于 同一 术语 (同义词 ) 有 不 同 解释 是 很 正常 见 的 。 例 如 ， 财 务 部 可 能 只 定义 那些 曾经 购买 过 产 
曲 的 组 织 和 个 人 为 顾客 ， 但 这 一 定义 并 没有 包括 那些 潜在 的 顾客 。 营 销 部 对 顾客 的 定义 如 下 : 
任何 与 他 们 有 联系 的 人 ， 已 经 从 公司 购买 过 产品 的 人 或 从 公司 的 竞争 者 那里 购买 过 产品 的 人 。 
-个 精确 、 完 整 的 E-R 图 必须 清晰 地 定义 元 数据 ， 否 则 ， 该 图 在 不 同 的 人 看 来 可 能 会 产生 不 同 
的 理解 。 

在 E-R 图 中 ， 每 一 条 线 末 端的 符号 表示 联系 的 基数 。 参 见 图 3-1 ， 可 以 看 出 这 些 基 数 符号 表 
示 以 下 业务 规则 。 





SUPPLIER 


Vy 








革 强制 1 
一 < 强制 多 
一 合十 可 选 ! 
一 合 志 中选 多 





图 3-1 E-R 模 型 示例 


1) SUPPLIER 可 能 提供 多 个 ITEM (“可 能 提供 ”意味 着 有 可 能 -个 也 不 提供 )。 每 个 ITEM 
都 由 一 些 SUPPLIER 提 供 (“提供 ”意味 着 ITEM 至 少 出 自 一 家 供 货 商 )。 

2) 每 个 ITEM 必 须 用 于 至 少 一 种 PRODUCT 的 组 装 ， 也 可 以 用 于 多 种 产品 的 组 装 。 相 反 ， 
每 种 PRODUCT 必 须 使 用 一 至 多 个 ITEM 进 行 组 装 。 

3) 一 个 SUPPLIER 可 以 发 出 多 次 SHIPMENT。 另 一 方面 ， 每 个 送 货 单 必须 由 且 仅 由 一 个 
SUPPLIER 发 出 。 注意， 发 货 和 供 货 是 两 个 概念 : 一 个 SUPPLIER 可 能 能 够 提供 零 部 件 ， 但 可 
能 还 没有 发 出 关于 零 部 件 的 送 货 单 。 

4) 一 个 SHIPMENT 必 须 包 含 一 2 RSWONDER Me Et 包含 在 几 个 SHIPMENT 中 。 

5) 一 个 CUSTOMER 可 能 提交 一 至 多 份 ORDER。 但 是 ， 一 份 ORPER 必 须 由 且 仅 由 一 个 





CUSTOMER 提 交 。 
6) 一 个 ORDER 必须 包括 一 至 多 个 PRODUCT。 某 种 PRODUCT 可 能 没有 ORDER 来 订购 ， 
但 也 可 能 会 被 一 至 多 个 ORDER 订购 。 
注意 ， 每 一 个 业务 规则 大 致 遵循 以 下 语法 : 
< 实体 >< 最 小 基数 >< 联 系 >< 最 大 基数 >< 实 体 > 
例如 ， 规 则 5 可 表示 如 下 : 
<CUSTOMER>< 可 能 >< 提 交 >< 任 何 数字 ><ORDER> 
该 语法 给 出 一 个 将 每 个 联系 放 在 用 自然 英语 描述 的 业务 规则 中 的 标准 方法 。 
3.4.2 E-R 模 型 符 各 
在 图 3-2 的 E-R 图 中 显示 了 本 书 使 用 的 基本 符号 。 正 如 在 前 一 节 所 指出 的 ， 在 业界 还 不 存在 
统一 的 标准 符号 (实际 上 ， 在 第 1 章 和 第 2 章 看 到 的 符号 稍微 进行 了 简化 )。 但 是 ， 图 3-2 中 的 符 
号 已 经 包括 E-R 图 的 常用 符号 体系 的 大 多 数 通用 特征 ， 并 且 能 够 在 大 多 数 实 际 情况 下 精确 地 表 
示 模 型 。 在 第 4 章 中 将 介绍 用 来 加 强 实体 -联系 模型 的 一 些 其 他 符号 (包括 类 - 子 类 联系 等 )。 
基本 符号 








强 实体 < > 联系 属性 
L 
上 一 
‘ ; 导出 属性 





< 四 
联系 的 度 


区 


联系 的 基数 


图 3-2 基本 E-R 符 号 
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附录 A 描述 在 许多 图 形 工具 中 使 用 的 E-R 符 号 。 这 个 附录 可 以 帮助 读者 在 书 中 的 符号 和 实际 使 
用 符号 之 间 进 行 互相 转换 。 


3.5 实体 -联系 模型 的 结构 


实体 -联系 模型 的 基本 结构 由 实体 、 联 系 和 属性 所 组 成 。 如 图 3-2 所 示 ， 模 型 允许 对 每 种 结 
构 进行 扩展 。E-R 模 型 的 丰富 特性 使 设计 者 可 以 对 真实 世界 的 各 种 情况 建立 准确 和 充分 的 模型 ， 
这 也 是 该 模型 广泛 使 用 的 原因 。 
3.5.1 实体 
实体 (entity ) 表示 组 织 所 期 望 维护 的 数据 ， 是 指 存在 于 用 户 环境 中 的 人 、 地 点 、 对 象 、 
事件 或 概念 。 下 面 是 各 种 类 型 的 实体 。 
人 (Person): EMPLOYEE (员工 )、STUDENT (学 生 )、PATIENT (病人 ) 
地 方 (Place): STORE (商店 )、WAREHOUSE (仓库 )、STATE ( 州 ) 
对 象 (Object): MACHINE (机 器 )、BUILDING (建筑 )、AUTOMOBILE (汽车 ) 
事件 (Event): SALE (销售 )、REGISTRATION (注册 )、RENEWAL (更 新 ) 
概念 (Concept): ACCOUNT (账目 )、COURSE (课程 )、WORK CENTER (加 工 中 心 ) 
1. 实 体 类 型 与 实体 实例 
实体 类 型 与 实体 实例 的 区 别 是 十 分 明显 的 。 实 体 类 型 (entity type) 是 具有 共同 性 质 和 特 
征 的 实体 集合 。E-R 模 型 中 的 每 个 实体 类 型 都 有 一 个 名 字 。 由 于 名 字 表 示 的 是 一 个 特定 的 集合 ， 
所 以 名 字 总 是 单数 的 。 实 体 类 型 的 名 字 通 常 使 用 大 写字 母 。 在 E-R 图 中 ， 实 体 名 字 放 在 代表 实 
体 类 型 的 矩形 框 中 ( 见 图 3-1 )。 
实体 实例 (entity instance) 是 实体 类 型 集合 中 的 一 个 特定 记录 。 图 3-3 描 述 一 个 实体 类 型 
与 其 两 个 实例 之 间 的 区 别 。 在 数据 库 中 ， 一 个 实体 类 型 仅 ( 使 用 元 数据 ) 描述 一 次 ， 但 实体 类 
型 的 实例 则 由 数据 库 中 的 数据 表示 。 例 如 ， 在 大 多 数组 织 中 都 存在 EMPLOYEE 这 样 一 种 实体 
类 型 ， 但 数据 库 中 却 存 储 着 数 百 (其 至 数 千 ) 个 该 实体 类 型 的 实例 。 在 不 引起 歧义 的 情况 下 ， 
本 书 通常 应 用 术语 “实体 ”而 不 是 实体 类 型 。 
实体 类 型 :EMPLOYEE 
属性 : 
EMPLOYEE NUMBER CHAR (10) 
NAME CHAR (25) 
ADDRESS CHAR (30) 
CITY CHAR (20) 
STATE CHAR (2) 
ZIP CHAR (9) 
DATE HIRED DATE 
BIRTHDATE DATE 


EMPLOYEE 的 两 个 实例 : 
642-17-8360 534-10-1971 
Michelle Brady David Johnson 
100 Pacific Avenue 450 Redwood Drive 
San Francisco Redwood City 


03-21-1992 08-16-1994 
06-19-1968 09-04-1975 


图 3-3 实体 类 型 (EMPLOYEE) 与 其 两 个 实例 
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2. 实体 类 型 与 系统 输入 、 输 出 或 用 户 

省 读者 开 全 党 会 制 E-R 图 时 ， 特 别 是 如 果 对 数据 处 理 模型 〈 如 数据 流 图 ) 已 经 很 清楚 的 
前 提 下 ， 可 能 会 犯 一 个 常见 的 错误 ， 那 就 是 将 数据 实体 和 整个 信息 系统 模型 中 的 其 他 元 素 相 混 
清 。 有 一 个 简单 的 规则 可 以 避免 产生 这 种 混淆 ， 即 一 个 真正 的 数据 实体 有 很 多 实例 ， 但 每 个 实 
例 都 具有 一 个 可 以 区 分 的 特征 ， 以 及 一 个 或 多 个 其 他 的 描述 性 数据 。 

如 图 3-4a 所 示 ， 该 图 描述 一 个 存储 女生 联谊 会 开支 的 数据 库 系 统 。 在 这 种 情况 下 ， 女 生 联 
讶 会 的 出 纳 管 理 账 务 ， 接 收 开 支 报告 ， 并 且 记 录 每 一 笔 账 务 的 开支 事项 。 但 是 ， 是 否 必 须 记录 
有 关 Treasurer (TREASURER 实 体 类 型 ) 的 每 一 个 数据 和 她 对 账 务 的 每 一 次 管理 (Manages 联 系 ) 
以 及 每 一 次 接收 报告 的 详细 过 程 (Receives 联 系 ) ? Treasurer 输 入 有 关 账 务 和 开支 的 数据 ， 并 且 
接收 开支 报告 。 也 就 是 说 ， 她 是 一 个 数据 库 的 用 户 。 既 然 只 有 一 个 出 纳 ， 那 么 TREASURER 数 
据 就 不 必 存 储 。 更 进 -- 步 ， EXPENSE REPORT 实 体 有 必要 吗 ? 既然 开支 报告 能 够 由 开支 事项 和 
账户 余额 计算 出 ， 那 么 它 可 由 数据 库 中 的 数据 导出 。 即 使 出 纳 在 不 同时 间 收 到 很 多 份 开支 报告 ， 
每 份 报告 中 的 数据 都 可 以 由 数据 库 中 已 有 的 ACCOUNT 和 EXPENSE 实 体 类 型 计算 出 。 

联系 Receives 和 Summariazes 名 称 的 本 质 是 另 一 个 有 助 于 我 们 理解 为 什么 图 3-4a 中 E-R 图 出 
错 的 关键 之 处 。 这 些 联系 名 指 的 是 转移 或 转换 数据 的 业务 活动 ， 并 不 仅仅 是 一 种 数据 到 另 一 种 
数据 的 关联 。 如 图 3-4b 所 示 ， 这 个 简单 的 E-R 图 中 实体 和 联系 已 经 足以 表示 上 述 女 生 联 谊 会 的 


开支 系统 。 
TREASURER 
ACCOUNT 


a) 系统 用 户 ( (Treasurer) 和 输出 (Expense Report) 被 表示 为 实体 


ACCOUNT ls_charged > EXPENSE 


b) 仅 包 括 必 昌 实体 的 E-R 模 型 
图 3-4 不 适当 的 实体 的 例子 











3. 强 实体 类 型 与 弱 实 体 类 型 

大 多 数 在 组 织 中 定义 的 基本 实体 类 型 都 被 归 为 强 实体 类 型 。 强 实体 类 型 (strong entity type) 
是 不 依赖 于 其 他 实体 而 独立 存在 的 实体 类 型 。 其 例子 有 STUDENT、EMPLOYEE、 
AUTOMOBILE 和 COURSE。 在 强 实体 类 型 的 一 个 实例 中 ， 总 可 以 我 出 一 个 惟一 的 特征 ( 称 为 





锣 3 划 ”组 织 由 的 数据 建 横 79 





标识 符 )， 也 就 是 区 别 于 该 类 型 的 其 他 实例 的 -一 个 属性 或 属性 集合 。 

相 比 较 而 言 ， 弱 实体 类 型 (weak entity type) 是 依赖 于 其 他 实体 类 型 而 存在 的 实体 类 型 。 
在 E-R 图 中 ， 能 实体 类 型 如 果 设 有 它 所 依赖 的 实体 ， 则 它 是 没有 意义 的 。 被 弱 实 体 类 型 所 依赖 
的 实体 类 型 称 为 标识 属 主 (identifying owner) (或 简称 为 属 主 )。 一 个 弱 实 体 类 型 没有 属于 它 
自己 的 标识 符 。 通 常 在 E-R 图 中 ， 一 个 弱 实 体 类 型 有 一 个 属性 ， 作 为 一 个 部 分 (partial) 标识 
符 。 到 设计 的 后 续 阶 段 〈 在 第 5 章 中 描述 )，、 通 过 将 其 属 主 的 标识 符 和 部 分 标识 符 相 绑 定 ， 会 形 
成 一 个 弱 实 体 类 型 的 完整 标识 符 。 

图 3-5 描 述 了 一 个 具有 标识 联系 的 弱 实 体 类 型 的 例子 。EMPLOYEE 是 一 个 强 实体 类 型 ， 其 
标识 符 为 Employee_ID (我 们 在 图 中 以 下 划 线 来 表示 标识 符 属性 )。DEPENDENT (家 属 ) 是 一 
个 弦 实 体 类 型 ， 在 图 中 用 双边 框 的 矩形 表示 。 Oa tet i 
(identifying relationship)。 在 图 3-5 中 ,“Has” 是 一 个 标识 联系 (在 图 中 用 双边 框 的 菱形 表示 )。 
属性 Dependent_Name 是 一 个 部 分 标识 符 (下 如 在 后 面 所 描述 的 ， Dependent_Name 是 一 个 可 以 
分 解 成 更 小 的 组 成 部 分 的 复合 属性 )。 本 书 使 用 双 下 划 线 来 表示 部 分 标识 符 。 在 后 面 的 设计 中 ， 
Dependent_Name 会 结合 Employee_ID ( 属 主 的 标识 符 ) 形成 DEPENDENT 的 完整 的 标识 符 。 





图 3-5 弱 实 体 类 型 与 其 标识 联系 的 实例 


4. 命 名 和 定义 实体 类 型 

除了 命名 和 定义 数据 对 象 的 一 般 性 原则 以 外 ， 还 有 一 些 特殊 的 命名 实体 美 型 的 原则 如 下 

* 实 体 类 型 名 是 一 个 单数 名 词 ( 例 如 CUSTOMER、STUDENT 或 AUTOMOBILE); 实体 
是 人 、 地 方 、 对 象 、 事 件 或 概念 ， 即 可 使 用 这 些 名 字 命 名 实体 类 型 。 实 体 类 型 代表 实体 
实例 的 集合 (例如 ， SIUDENT 可 以 代表 学 生 Hank Finley、Jean Krebs 等 等 )。 用 复数 名 
词 来 表示 实体 类 型 也 是 常见 的 〈 可 能 在 一 些 附带 E-R 图 的 CASE 工 具 信息 库 中 会 遇 到 )。 
因为 有 时 E-R 中 的 元 素 最 好 被 解读 为 复数 。 例 如 ， 在 图 3-1 中 ， 一 个 SUPPLIER 可 能 提供 
多 个 ITEM。 注 意 ， 英 语 的 复数 并 不 总 是 由 单数 名 词 加 s 组 成 ， 所 以 应 该 使 用 正确 的 复 
数 形式 。 

。 一 个 实体 类 型 名 的 应 用 范围 应 限于 特定 的 组 织 。 一 个 组 织 可 以 用 CUSTOMER 作 为 实体 类 
型 名 ， 而 另 一 个 组 织 可 以 使 用 术语 CLIENT。 实 体 类 型 的 名 字 对 于 这 个 组 织 来 说 应 该 是 
易于 描述 和 理解 的 ， 并 且 易 于 与 组 织 中 的 其 他 实体 类 型 名 相 区 分 。 例 如 ， 一 个 和 供 货 商 
相 联系 的 PURCHASE ORDER 和 一 个 与 顾客 有 关 的 CUSTOMER ORDER 很 容易 区 分 。 但 
这 两 种 实体 类 型 不 能 被 命名 为 ORDER 。 








。 实 体 类 型 名 应 该 简洁 ， 使 用 的 单词 应 尽 可 能 少 。 例 如 ， 在 一 个 大 学 的 数据 库 中 ， 以 
REGISTRATION 作 为 学 生 注册 班级 这 个 实体 类 型 的 名 字 就 足够 了 。 而 短语 STUDENT 
REGISTRATION FOR CLASS 尽管 十 分 精确 ， 但 如 果 读 者 能 够 理解 REGISTRATION 的 明 
确 含义 ， 那 么 用 这 个 短语 就 显得 有 些 哆 嗪 。 

。 实 体 类 型 名 称 应 该 使 用 简短 的 名 字 或 缩 略 语 。 在 E-R 图 时 中 ， 使 用 缩 略 语 就 足够 了 。 缩 
略语 的 命名 规则 应 该 和 实体 的 命名 规则 相同 。 

*。 事 件 实体 类 型 应 该 根据 事件 的 结果 来 命名 ， 而 不 是 根据 事件 的 活动 或 过 程 来 命名 。 例 如 ， 
在 一 个 项 目 经 理 安排 一 个 员工 去 完成 一 个 项 目的 事件 中 , 会 产生 ASSIGNMENT (安排 ) 
结果 ; 同样 ， 一 个 学 生 去 联系 他 的 指导 教师 查 一 些 资料 ， 这 个 事件 产生 一 个 结果 
CONTACT (联系 )。 

。 在 所 有 E-R 图 中 ， 同 样 的 实体 类 型 应 具有 相同 的 名 字 。 对 于 特定 的 组 织 ， 用 于 表示 实体 
类 型 的 名 字 也 应 符合 相应 标准 ， 组 织 采用 这 个 标准 引用 所 有 同一 类 型 的 数据 。 但 是 、 一 
些 实体 类 型 具有 别名 ， 或 可 替换 的 名 字 ， 它 可 以 作为 同义词 用 于 组 织 中 的 其 他 部 分 、 例 
如 ， 实 体 类 型 ITEM 可 以 有 一 个 别名 MATREIAL (在 生产 中 ) 和 DRAWING( 在 设计 中 )。 
别名 在 数据 库 的 相关 文件 中 定义 ， 例 如 在 CASE 工 具 的 信息 库 中 指定 。 

还 有 一 些 用 于 定义 实体 类 型 的 特殊 准则 如 下 : 

*。 实 体 类 型 定义 通常 以 “X 是 …… ”开头 。 这 是 描述 实体 类 型 含义 的 最 直接 和 最 明确 的 
方法 。 

“实体 类 型 定义 应 该 包括 这 样 的 语句 : 哪个 特征 惟一 标识 了 实体 类 型 实例 。 在 许多 情况 下 ， 
声明 实体 类 型 的 标识 符 有 助 于 说 明 实体 的 含义 。 例 如 ， 在 图 3-4b 中 ,，“ 支 出 就 是 用 于 购买 
某 些 商 品 或 服务 的 款项 。 支 出 由 分 类 账 中 的 账目 号 惟一 确定 ”。 

。 实体 类 型 定义 应 该 清晰 地 表达 该 实体 类 型 包含 哪些 实体 实例 ， 以 及 不 包含 哪些 实体 实例 。 
通常 ， 有 必要 列 出 所 有 需要 排除 的 实例 种 类 。 例 如 ,“ 顾 客 是 一 个 已 经 下 订单 购买 产品 的 
个 人 或 组 织 ， 或 者 是 组 织 已 经 联系 并 利用 广告 或 促销 手段 向 其 推广 产品 的 个 人 和 组 织 。 
顾客 不 包括 那些 通过 我 们 的 顾客 、 分 销 商 和 代理 机 构 购 买 产品 的 个 人 或 组 织 。” 

* 实体 类 型 定义 通常 包括 这 样 一 个 描述 : 什么 时 候 创 建 实体 类 型 实例 ， 什 么 时 候 删 除 实体 
类 型 实例 。 例 如 ， 在 上 文中 ， 当 个 人 或 组 织 发 提交 他 的 第 一 份 订单 时 ， 就 隐 式 地 创建 一 
个 顾客 实例 。 因 为 定义 中 没有 说 明 除 此 之 外 会 怎样 ， 所 以 说 明 顾 客 实例 不 会 被 删除 ， 而 
只 能 根据 数据 库 中 清理 数据 的 一 般 规则 来 删除 。 关 于 何 时 删除 实体 实例 有 时 也 被 称 为 是 
实体 类 型 的 保留 周期 。 如 一 个 删除 客户 实体 类 型 定义 的 语句 可 以 是 “如 果 一 个 顾客 超过 
三 年 未 提交 订单 ， 则 他 不 再 是 顾客 ”。 

“对 于 一 些 实体 类 型 ， 定义 必须 指出 什么 时 候 一 个 实例 会 变 为 另 一 个 实体 类 型 的 实例 。 例 
如 ， 考 虑 一 个 建筑 公司 ， 其 投标 用 的 标书 可 能 被 潜在 的 顾客 接受 而 成 为 合同 。 在 这 种 情 
况 下 ， 标 书 可 以 定义 为 “公司 制定 的 要 为 顾客 工作 的 合法 的 文件 ， 当 公司 的 主管 在 投标 
文件 上 签字 后 生成 标书 ， 在 收 到 由 顾客 的 主管 签字 的 标书 副本 时 ， 标 书 转化 为 一 个 合同 
的 实例 *"。 这 个 例子 也 较 好 地 说 明 某 个 定义 如 何 使 用 其 他 实体 类 型 名 (在 上 述 情况 下 ， 标 
书 的 定义 用 到 了 实体 类 型 名 Customer ) 。 

“ 对 于 一 些 实体 类 型 ， 定 义 必 须 说 明 应 保存 实体 类 型 实例 哪些 方面 的 历史 记录 。 例 如 ， 图 3-1 
中 ITEM 的 特征 可 能 会 随 着 时 间 发 生变 化 ， 并 且 公司 应 该 保留 一 份 有 关 单价 和 单价 生效 时 
间 的 完整 历史 记录 。 在 以 后 的 例子 中 会 看 到 ， 这 种 关于 保存 历史 记录 的 语句 可 能 会 衍生 出 
以 下 间 题 ， 如 何在 E-R 图 上 表示 与 实体 类 型 ， 以 及 最 终 如 何 存储 该 实 体 实例 的 数据 。 
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3.5.2 属性 

每 一 个 实体 类 型 都 有 一 组 与 其 相关 的 属性 。 属 性 (attribute) 是 组 织 所 关心 的 实体 类 型 的 
一 个 性 质 或 特征 。 下 面 是 一 些 典 型 的 实体 类 型 和 与 之 相 联系 的 属性 。 

"STUDENT: Student_ID (学 生 的 ID)、Student_Name (学 生 姓 名 )、Home_Address (家 

庭 住址 )、Phone_Number (电话 号 码 )、Major (专业 )。 

*AUTOMOBILE: Vehicle_ID (汽车 ID)、Color (颜色 )、Weight (重量 )、Horsepower 

(马力 )。 
* EMPLOYEE: Employee_ID (员工 ID)、Employee_Name (员工 姓名 )、Payroll_Address 
(工资 单 地 址 )、Skill (技能 )。 

在 命名 属性 时 ， 应 使 用 首 字 母 大 写 、 其 他 字母 小 写 的 形式 。 如 果 属 性 名 包括 两 个 单词 ， 就 
使 用 “_“ 来 连接 两 个 单词 ， 两 个 单词 的 首 字母 都 大 写 。 例 如 ，Employee_Name。 在 E-R 图 中 ， 
使 用 椭圆 来 表示 属性 ， 属 性 名 写 在 椭 贺 中间， 椭圆 用 一 条 线 与 其 关联 实体 连接 起 来 。 属 性 也 可 
与 联系 连接 ， 下 面 将 介绍 这 种 情况 。 注 意 ， 属 性 必须 准确 地 与 相关 的 实体 或 联系 连接 。 

注意 ， 在 图 3-5 中 ，DEPENDENT 的 所 有 属性 都 是 员工 家 属 的 特征 ， 而 不 是 员工 的 特征 。 
一 个 实体 类 型 (无论 是 弱 实 体 类 型 还 是 其 他 实体 类 型 ) 不 能 包括 与 之 相关 的 实体 的 属性 〈 称 之 
为 外 键 )。 例 如 ，DEPENDENT 没 有 包含 该 家 属 与 哪个 员工 相关 联 的 属性 ， 即 E-R 数 据 模型 中 具 
有 属性 非 元 余 的 特征 。 在 数据 库 中 ， 有 些 数 据 可 以 被 多 个 实体 共享 。 这 两 者 是 不 矛盾 的 。 因 为 
在 数据 库 中 ， 是 通过 实体 类 型 之 间 的 属性 联系 实现 数据 访问 的 (例如 ， 在 一 个 屏幕 上 显示 
Dependent_Name 和 相应 的 Employee_Name ) 。 

每 个 实体 (或 实体 类 型 的 实例 ) 在 每 个 属性 上 都 有 一 个 相应 的 值 。 例 如 ， 图 3-6 显 示 拥 有 
各 自 属性 值 的 两 个 实体 。 从 本 质 上 说 ， 一 个 数据 库 就 是 赋予 实体 的 所 有 属性 值 的 集合 。 实体 可 
以 看 作 是 由 一 个 标识 符 属性 和 一 个 或 多 个 其 他 属性 组 合 而 成 的 。 如 果 尝 试 创建 只 有 一 个 标识 名 
的 实体 ， 那 么 这 个 实体 可 能 不 合法 。 这 样 一 个 数据 结构 可 能 只 保存 一 些 属性 的 合法 值 的 列表 ， 
这 些 列表 最 好 保存 在 数据 库 之 外 。 








实体 1 


Student_ID = 638124289 

Student Name = Allison Smith 

Home_Address = 482 Walnut St. 
Denver CO 86391 

Phone = 303-839-1479 

Major = Psychology 


实体 2 


Student_ID = 726153972 
Student Name = Cedric Thomas 
Home_Address = 944 Maple St. 
Houston, TX 51269 
Phone = 631-347-9847 
Major = English 


















图 3-6 两 个 实体 实例 与 其 属性 值 
1. 简单 属性 与 复合 属性 
一 些 属性 可 以 分 解 为 粒度 更 小 的 有 明确 含义 的 组 成 部 分 。 最 常见 的 例子 是 Address， 它 可 以 
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分 解 成 如 下 一 些 部 分 : Street_ Address (街区 )、City (城市 )、State ( 州 ) 和 Postal_Code (邮政 
编码 )。 复 合 属性 (composite address) 就 是 能 分 解 为 更 小 部 分 的 属性 (如 Address )。 图 3-7 显 示 
在 此 例 中 用 于 表示 复合 属性 的 符号 。 在 E-R 图 中 ， 子 属性 可 能 会 在 复合 属性 的 上 方 或 下 方 出 现 

复合 属性 为 用 户 提供 了 相当 大 的 灵活 性 ， 用 户 既 可 以 把 复合 属性 当 作 一 一 个 完整 的 单元 来 应 
用 ， 也 可 以 应 用 复合 属性 中 的 单独 部 分 。 例 如 ， 一 个 用 户 既 可 以 引用 Address， 也 可 以 引用 
Address 的 一 部 分 ， 如 Street_Address。 是 否 将 属性 分 解 为 更 小 的 部 分 取决 于 用 户 是 否 需要 使 用 
那些 单独 的 属性 。 当 然 ， 设 计 者 必须 明确 地 预计 到 未 来 数据 库 的 使 用 模式 。 

简单 (或 原子 ) 属性 (simple attribute) 是 不 能 分 解 为 更 小 部 分 的 属性 。 例 如 ， 所 有 与 
AUTOMOBILE 相 联系 的 属性 都 是 简单 属性 : Vehicle_ID、Color、Weight 和 Horsepower。 

2. 单 值 属性 与 多 值 属性 

图 3-6 显 示 两 个 实体 与 其 各 自 的 属性 值 。 对 于 每 个 实体 实例 ， 图 中 的 每 一 个 属性 都 有 一 个 
值 。 经 常会 有 这 样 的 情况 ， 即 给 定 实体 实例 的 一 个 属性 会 有 一 个 或 多 个 值 。 例 如 ， 图 3-8 中 
EMPLOYEE 实 体 类 型 有 一 个 名 为 Skill 的 属性 ， 其 值 记 录 员 工 的 技能 。 当 然 ， 某 些 员工 会 具备 
多 种 技能 (例如 ， 同 时 是 COBOL 程 序 员 和 C++ 程序 员 )。 多 值 属性 (multivalued attribute ) 就 
是 在 给 定 实体 实例 中 可 以 有 多 个 值 的 属性 。E-R 图 中 用 双边 椭圆 来 表示 多 值 属性 ,如 图 3-8 所 示 ， 
在 EMPLOYEE 的 例子 中 ，Skill 属 性 就 是 多 值 属性 。 








(wee ) 


Cw DC em ) A> Postal 人 


图 3-7 复合 属性 


图 3-8 具有 多 值 属 性 (Skill) 和 导出 属性 (Years_Employed) 的 实体 


Employee_ID 
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3. 存储 属性 与 导出 属性 

对 于 用 户 来 说 , 他 们 所 感 兴趣 的 一 些 属性 值 可 以 由 数据 库 中 现 有 的 相关 属性 值 计 算 或 导出 。 
例如 ,假设 对 于 “个 组 织 来 说 ，EMPLOYEE 实 体 类 型 有 一 个 Date_Employed (雇佣 日 期 ) 属性 。 
如 果 用 户 想 知道 一 个 员工 在 此 工作 了 多 少年 ， 可 以 用 Date_Employed 和 当前 日 期 计算 出 来 。 导 
出 属性 (derived attribute ) 就 是 一 个 其 值 可 以 由 其 他 相关 属性 值 计 算出 的 属性 (参与 计算 的 其 
他 数据 也 可 能 不 在 数据 库 中 ， 如 当前 日 期 ， 当 前 时 间 ， 或 者 由 系统 用 户 提 供 的 口令 等 )。 在 E-R 
图 中 使 用 边 为 虚线 的 椭圆 表示 导出 属性 ， 如 图 3-8 所 示 。 

在 某 些 情况 下 ， 属 性 值 不 能 由 相关 实体 的 属性 导出 。 考 虑 松 谷 家 具 公 司 给 每 一 位 顾客 出 具 
的 发 票 ( 见 图 1-6)。Order_Total (订单 总 价值 ) 是 INVOICE 实 体 的 属性 ， 它 表示 顾客 应 付 的 总 
金额 。Order_Total 属 性 值 可 以 由 发 票 上 列 出 的 各 项 的 Extended_Price 属 性 值 的 总 计 得 到 。 这 样 
的 数值 计算 公式 也 是 一 种 业务 规则 。 

4. 标识 符 属性 

标识 符 (identifier) 是 可 以 惟一 标识 一 个 实体 类 型 实例 的 属性 或 属性 集 。 在 前 面 介绍 的 
STUDENT 实 体 类 型 中 ， 其 标识 符 属性 为 Student_ID， 而 AUTOMOBILE 实 体 类 型 的 标识 符 属 性 
为 Vehicle ID。 注意 ， 像 Student_Name 这 样 的 属性 不 能 作为 备 选 的 标识 符 属 性 ， 因 为 学 生 既 有 
可 能 重 名 ， 也 有 可 能 改名 。 要 成 为 候选 的 标识 符 ， 每 一 个 实体 实例 必须 有 该 属性 的 一 个 值 ， 并 
且 属 性 必须 与 实体 关联 。 在 E-R 图 中 以 下 划 线 表示 标识 符 属 性 ， 如 图 3-9a 所 示 。 

对 很 多 实体 类 型 来 说 ， 没 有 哪 一 个 单独 (原子 ) 的 属性 能 作为 标识 符 ， 即 没有 -- 个 属性 能 
够 惟一 标识 一 个 实体 。 但 是 ， 两 个 或 更 多 属性 的 组 合 则 可 以 作为 标识 符 来 标识 实体 。 在 这 种 情 
况 下 ， 可 以 用 这 些 属 性 所 组 成 的 一 个 复合 属性 作为 一 个 标识 符 ， 即 复合 标识 符 (composite 
identifier ) 。 图 3-9b 显 示 具 有 复合 标识 符 Flight_ID (航班 号 ) 的 实体 FLIGHT。 Flight_ID 由 子 属 
性 Flight_Number 和 Date 组 成 。 对 于 惟一 标识 实体 FLIGHT 来 说 ， 这 些 属性 缺 一 不 可 。 在 E-R 图 
中 ， 在 复合 属性 《Flghit_ID) 下 加 下 划 线 表示 标识 符 ， 而 其 子 属性 则 没有 下 划 线 。 

有 时 实体 可 能 会 有 多 个 备 选 的 标识 符 。 在 这 种 情况 下 ,设计 者 必须 选择 其 一 作为 标识 符 属 
性 。Bruce(1992) 建 议 使 用 以 下 标准 来 选择 标识 符 。 

1) 将 每 一 个 实体 类 型 实例 的 生存 周期 中 其 值 都 不 变 的 属性 作为 标识 符 。 例 如 ， 
Employee_Name 和 Payroll_Address 的 组 合并 不 是 一 个 好 的 标识 符 ， 因 为 在 EMPLOYEE 实 体 类 
型 中 ，Employee_Name 和 Payroll_Address 的 值 在 员工 的 雇佣 期 间 很 容易 发 生 改 变 。 

2) 选择 在 每 个 实体 类 型 的 实例 中 ， 该 属性 值 都 有 效 且 不 为 空 的 属性 作为 标识 符 。 如 果 标 识 
符 是 一 个 复合 属性 ，( 如 图 3-9 中 的 Flight_ID )， 要 确保 标识 符 的 每 一 部 分 都 不 为 空 。 

3) 避免 使 用 所 谓 的 智能 标识 符 (或 键 )。 这 种 标识 符 的 结构 表示 分 类 、 位 置 等 信息 。 例 如 ， 
标识 符 的 前 两 位 可 能 表示 仓库 的 位 置 。 这 种 代码 会 随 着 条 件 的 改变 而 变化 ， 容 易 产 生 标 识 符 非 
法 的 情况 。 

4) 尽量 使 用 单 值 属性 作为 标识 符 。 例 如 ， 在 实体 类 型 GAME (比赛 ) 中 ， 应 用 
Game_Number (比赛 编号 ) 属性 作为 标识 符 ， 而 不 用 Home_Team (主队 :) 和 Visiting_Team 
(客队 ) 的 组 合作 为 标识 名 

3. 命名 与 定义 属性 

除了 命名 数据 对 象 的 一 般 原 则 外 ， 以 下 还 给 出 一 些 专用 于 属性 命名 的 原则 。 

“ 属性 名 是 一 个 名 词 〈 例 如 Customer_ ID 、Age、Product_Minimum_Price 或 者 Major)。 属 性 

通过 赋值 拥有 一 个 具体 的 含义 ， 它 描述 实体 的 概念 或 物理 特征 。 在 客观 世界 中 ， 概 念 或 
物理 特征 一 般 用 名 词 来 描述 。 . 








Other_Attributes 












STUDENT 


a) 简单 标识 符 属性 


Number_of_Passengers 






FLIGHT 


b) 复合 标识 符 属性 
图 3-9 简单 标识 符 属性 与 复合 标识 符 属 性 


“属性 名 应 该 是 惟一 确定 的 。 一 个 实体 中 不 能 有 两 个 同名 的 属性 。 如 果 可 能 的 话 ， 在 所 有 
的 实体 中 也 不 要 出 现 同名 的 属性 ， 以 避免 混淆 。 

* 为 了 使 属性 名 具有 惟一 性 并 易于 区 分 ， 在 一 个 系统 的 建 模 中 ， 所 有 的 属性 命名 应 遵守 一 
个 标准 有 形式。 例如， 在 大 学 数据 库 中 ， 可 能 以 Student_GPA (学 生平 均 积分 点 ) 的 形式 作 
为 一 个 属性 的 标准 形式 ， 而 如 果 命 名 为 GPA_of_ Student 就 违反 了 这 一 标准 。 每 个 组 织 
应 该 建立 这 样 的 标准 。 常 用 的 形式 为 : [实体 类 型 名 {[_ 限 定 符 ]}_] 类 别 ， 其 中 […] 内 为 可 
选 子 句 ，{…} 表 明 该 子 句 可 能 重复 。 实 体 类 型 名 (entity type name) 是 与 该 属性 相关 的 实 
体 类 型 的 名 字 。 实 体 类 型 名 可 以 使 属性 名 含义 清楚 ， 一 般 在 实体 类 型 的 标识 符 属性 (如 
Customer_ID) 中 都 会 出 现实 体 类 型 名 。 类 别 是 组 织 所 定义 的 ， 描 述 实 体 的 某 类 特征 ， 通 
党 为 一 个 短语 或 其 缩 略 形式 。 可 以 作为 类 别 的 短语 及 其 缩 格 形式 有 : Name (Nm )、 
Identifier (ID )、Date (Dt) 或 Amount (Amt) 等 。 很 明显 ， 类 别 是 必需 的 。 限 定 符 是 组 
织 所 定义 的 ， 是 类 别 的 约束 条 件 。 在 某 些 情 况 下 ， 在 属性 名 中 加 入 一 个 或 多 个 限定 符 可 
以 确保 属性 名 的 惟一 性 。 例 如 ， 限 定 符 可 以 是 : Maximum (Max)、Hourly (Hrly) 或 
State (St)。 限 定 符 不 是 必需 的 ， 没 有 限定 符 的 属性 名 (如 Employee_Age 和 
Student_Major) 的 含义 也 同样 是 清楚 的 。 但 有 时 限定 符 是 必需 的 。 例 如 ，Employee 的 两 
个 属性 名 Employee_Birth_Date 和 Employee_Hire_Date 必 须 使 用 限定 符 来 加 以 区 别 。 在 有 
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些 情 况 下 ， 可 能 需要 多 个 限定 符 。 如 属性 Employee_Residence_City_Name (或 缩 略 形式 
Emp_Res_Cty_Nm ) 表示 员工 居住 的 城市 名 ， 而 属性 Employee_Tax_City_Name (或 其 缩 
咯 形 式 Emp_Tax_Cty_Nm ) 则 表示 员工 纳税 的 城市 名 。 

“在 一 个 组 织 中 ， 不 同 实体 类 型 的 相同 属性 应 使 用 相同 的 限定 符 和 类 别 。 例 如 ， 表 示 教 师 
和 学 生 所 在 城市 的 属性 名 应 该 分 别 为 Faculty_Residence_City_Name 和 
Student_Residence_City_Name。 使 用 类 似 的 名 字 可 以 提示 用 户 这 些 属性 值 的 值 域 是 相同 
的 。 用 户 可 能 会 在 查询 中 利用 域 相同 这 一 条 件 ， 如 查找 与 其 导师 住 在 同一 城市 的 学 生 时 
就 可 以 利用 这 一 条 件 。 在 这 种 情况 下 ， 如 果 用 户 在 两 个 属性 名 中 采用 同样 的 限定 符 和 类 
别 ， 则 用 户 更 加 可 以 认定 这 一 匹配 是 可 行 的 。 

对 于 属性 的 定义 ， 也 有 如 下 一 些 专用 的 原则 : 

“属性 定义 应 说 明 属 性 的 内 容 和 属性 之 所 以 重要 的 原因 。 属 性 的 定义 常 与 属性 的 命名 是 相 
关 的 ， 如 Student_Residence_City_Name 的 定义 是 “一 个 学 生 永 和 久居 住 的 城市 名 ”。 

。 属 性 定义 应 说 明 在 属性 值 中 所 包括 的 具体 内 容 和 不 属于 属性 值 的 内 容 。 如 “Employee_ 
Monthly_Salary_Amount 是 在 员工 居住 地 所 在 国 流通 的 、 按 月 支付 的 工资 数 ， 其 中 不 包括 
福利 、 奖 金 、 退 税 或 其 他 收入 ”。 

* 属性 的 别名 应 在 定义 中 声明 ， 或 在 其 他 说 明 属 性 的 文档 中 声明 ， 并 可 以 保存 在 CASE 工 具 
的 信息 库 中 来 维护 数据 定义 。 

* 在 某 些 情况 下 ， 属 性 的 数值 来 源 也 是 定义 中 的 重要 内 容 。 声 明 数值 来 源 可 以 使 数据 的 含 
义 更 加 明确 。 例 如 ,，“Customer_Standard_Industrial_Code 表 示 企 业 所 从 事 的 业务 类 型 。 
这 个 代码 的 值 来 自 联邦 贸易 委员 会 制定 的 一 个 标准 代码 集 ， 并 且 可 以 在 联邦 贸易 委员 会 
每 年 提供 的 名 为 SIC 的 CD 中 查 到 ”。 

“属性 定义 (或 CASE 工 具 信息 库 中 其 他 规格 说 明 ) 也 应 指出 属性 值 是 必需 的 还 是 可 选 的 。 
说 明 属 性 这 项 特征 的 业务 规则 对 于 维护 数据 完整 性 是 很 重要 的 。 在 定义 中 ， 必 须 指定 实体 
类 型 的 标识 符 属 性 。 如 果 属 性 值 是 必需 的 ， 那 么 在 创建 实体 类 型 的 实例 时 ， 必 须 为 该 属性 
赋值 。 必需 ”意味 着 在 每 个 实例 中 该 属性 都 有 一 个 值 ， 而 不 是 在 创建 实例 时 需要 值 。“ 可 
选 ” 则 意味 着 在 实体 的 某 些 实例 中 ， 该 属性 值 可 能 不 存在 。 可 通过 说 明 是 否 一 旦 要 输入 一 
个 属性 值 ， 则 该 值 必须 总 是 存在 的 以 便 进一步 限定 可 选 的 值 。 如 定义 “ ‘Employee_ 
Pepartment_ID 是 员工 所 在 部 门 的 标识 符 。 当 员工 被 雇佣 时 ， 可 能 还 没有 分 配 到 一 个 部 门 
中 (这 就 是 该 属性 可 选 的 原因 )。 一 旦 员工 被 分 配 到 一 个 具体 的 部 门 ， 该 属性 值 就 应 是 表 
示 该 部 门 的 值 ”。 

“属性 定义 (或 CASE 工 具 信息 库 中 其 他 规格 说 明 ) 也 需要 指出 在 实例 生存 期 间 ， 一 旦 赋值 ， 
属性 值 是 否 是 可 变 的 。 这 条 业务 规则 同样 控制 着 数据 完整 性 。 非 智能 标识 符 的 值 不 会 随 
时 间 而 改变 。 若 要 给 一 个 实体 实例 分 配 一 个 新 的 非 智 能 标识 符 ， 则 该 实例 应 先 被 删除 或 
重新 创建 。 

“多 值 属性 的 定义 中 应 指出 ， 在 一 个 实体 实例 中 属性 值 的 最 大 和 最 小 个 数 。 例如 ， 
“Employee_Skill -Name 是 一 个 员工 所 具备 的 技能 名 称 。 每 个 员工 至 少 必须 具备 一 种 技能 ， 
并 且 每 个 员 工 最 多 可 列 出 他 所 具备 的 10 种 技能 ”采用 多 值 属 性 的 原因 可 能 是 因为 要 保存 
属性 的 历史 记录 。 例 如 ， “Employee_Yearly_Absent_Days_Number 是 年 中 员工 缺勤 的 
次 数 。 如 果 员 工 在 工作 日 的 工作 时 间 少 于 规定 时 间 的 50%， 则 认为 是 缺勤 。 在 该 员工 为 
本 公司 工作 的 每 一 年 中 ， 都 需要 保存 此 属性 的 值 ”。 

-“ 属 性 定义 也 应 指出 该 属性 与 其 他 属性 之 间 的 关系 。 例 如 ， “Employee_Vacation_Days_ 








Number 是 员工 的 带 薪 休假 的 天 数 。 如 果 某 个 员工 的 Employee_Type 属 性 的 值 为 ”Exempt ， 
则 Employee_Vacation_Days_Number 的 属性 值 需 根 据 该 员工 的 工作 年 限 通 过 一 个 公式 计 
算得 出 ”。 


3.6 联系 


联系 将 E-R 图 中 所 有 部 分 连接 起 来 。 直 观 地 讲 ， 联 系 (relationship) 表示 的 是 组 织 感 兴 
的 一 或 多 个 实体 类 型 之 间 的 关联 。 为 了 更 清晰 地 理解 联系 的 定义 ， 必 须 分 清 联 系 类 型 和 联系 实 
例 之 间 的 区 别 。 例 如 ， 考 虑 实体 类 型 EMPLOYEE 和 COURSE， 这 里 COURSE 代 表 员 工 培训 课 
程 。 为 了 跟踪 某 个 员工 已 结束 的 某 门 课程 ， 在 这 两 个 实体 类 型 中 定义 联系 Completes (如 图 
3-10a 所 示 )。 这 是 一 个 多 对 多 的 联系 ， 因 为 一 个 员工 可 以 完成 多 门 课程 ， 而 一 门 课 程 可 以 由 任 
意 数量 的 员工 完成 。 例 如 ， 在 图 3-10b 中 ， 员 工 Melton 已 经 完成 三 门 课程 (C++、COBOL 和 
Perl1)。 有 两 个 员工 (Celko 和 Gosling) 已 经 完成 SQL 课程 。 

在 这 个 例子 中 ， 两 个 实体 类 型 (EMPLOYEE 和 COURSE) 参与 名 为 Completes 的 联系 。 通 
常 ， 任 意 多 个 实体 类 型 (从 一 个 到 多 个 ) 都 可 能 参与 到 一 个 联系 中 。 


Employee_Name 
EMPLOYEE [DS < COURSE 


员工 课程 


Chen 






Employee_ID 










a) 联系 类 型 (Completes) 





Mekon ”一 一 


Ritchie ~ ~ 





b) 联系 实例 
图 3-10 联系 类 型 和 联系 实例 
本 章 和 下 一 章 使 用 菱形 符号 和 一 个 动词 短语 表示 联系 。 因为 联系 通常 因 组 织 事 件 的 发 生 而 
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产生 ， 而 实体 实例 就 通过 这 个 动作 被 连接 起 来 ， 所 以 动词 短语 比较 合适 。 这 个 动词 短语 应 该 是 
描述 性 的 ， 并 使 用 现在 时 。 还 有 其 他 许多 方法 可 以 表示 联系 。 在 第 1 章 中 ， 应 用 另 一 个 常见 的 
符号 : 仅 用 一 条 线 来 表示 联系 ， 没 有 出 现 姜 形 ， 线 的 两 端 各 写 上 联系 的 名 称 。 一 些 数据 建 模 人 
员 更 愿意 使 用 这 种 方法 。 这 两 种 方法 在 结构 上 是 等 价 的 ， 可 以 任意 选用 其 中 一 种 。 
3.6.1 联系 的 基本 概念 和 定义 

联系 类 型 (reiationship type) 表示 实体 类 型 之 间 有 意义 的 关联 。“ 有 意义 的 关联 ”说 明 联 
系 中 包含 一 些 仅 用 实体 类 型 无 法 表示 的 含义 。 联 系 类 型 由 包含 类 型 名 的 萎 形 符号 表示 ， 如 图 
3-10a 中 的 例子 所 示 。 建 议 读者 使 用 尽量 短 的 、 描 述 性 的 动词 短语 ， 采 用 良好 的 命名 方式 对 于 
用 户 来 说 是 很 有 意义 的 (本 节 后 面 的 部 分 将 详细 讨论 联系 的 命名 和 定义 原则 )。 

联系 实例 (relationship instance) 是 实体 实例 之 间 的 关联 ， 每 个 联系 实例 恰 包 括 参与 联系 
的 各 实体 类 型 中 的 一 个 实例 (Elmasri 和 Navathe ，1994)。 例 如 ， 在 图 3-10b 中 ， 图 中 的 每 一 条 
线 代 表 一 个 员工 和 一 门 课程 之 间 的 联系 实例 ， 表 示 这 个 员工 已 经 结束 这 门 课程 。 

1. 联系 的 属性 

正如 实体 可 以 用 多 对 多 (一 对 一 ) 联系 关联 起 来 一 样 ， 属 性 也 可 以 用 多 对 多 (或 一 对 一 ) 
的 联系 关联 起 来 。 例 如 ， 假 设 员工 结束 课程 时 ， 组 织 希 望 记录 完成 课程 的 日 期 (月 、 年 )。 这 
个 联系 的 属性 名 为 Date_Completed。 其 他 一 些 例子 见 表 3-2。 - 

那么 ， 在 E-R 图 中 Date_Completed 属 性 应 放 在 什么 位 置 ? 参见 图 3-10a， 可 以 发 现 Date_ 
Completed 没 有 和 EMPLOYEE 或 COURSE 中 的 任 一 个 实体 发 生 联系 。 这 是 因为 Date_Completed 
是 联系 Completes 本 身 的 性 质 ， 而 不 是 任 一 个 实体 的 性 质 。 这 就 是 说 ， 在 每 一 个 联系 Completes 
的 实例 中 ， 都 有 一 个 Date_Completed 值 。 该 实例 表示 这 样 的 语义 : 员工 Melton 在 2000 年 6 月 结 
束 课程 C++ 的 学 习 。 

图 3-11a 是 描述 这 个 例子 的 修正 版 本 的 E-R 图 。 图 中 的 Date_Completed 连 接 到 连接 两 个 实体 
的 联系 符号 上 。 如 果 需 要 ， 也 可 以 在 联系 中 加 上 其 他 属性 ， 如 Course_Grade、Instructor 和 


Room_Location 。 


表 3-2 Data_Completed 联 系 的 实例 


Employee_Name Course_Title Date_Completed 
Chen C++ 06/2000 
Chen Java 09/2000 
Chen Basic 10/2000 
Melton C++ 06/2000 
Melton COBOL 02/2001 
Melton SQL 03/2000 
Ritchie Perl 11/2000 
Celko Java 03/2000 
Celko SQL 03/2001 
Gosling Java 09/2000 
Gosling Perl 06/2000 


OCC 
2. 关联 实体 


联系 本 身 拥 有 一 或 多 个 属性 ， 说 明 联系 可 以 和 实体 类 型 采用 同样 的 处 理 方式 。 关联 实体 
(associative entity) 表示 关联 一 个 或 多 个 实体 类 型 的 实例 之 间 的 实体 类 型 ， 同时 包含 特 属 于 实体 
实例 间 联 系 的 属性 。 关 联 实体 CERTIFICATE 由 矩形 框 加 上 菱形 的 符号 表示 ， 如 图 3-11b 所 示 。 在 
ER 图 中 ， 这 个 特殊 符号 表示 该 实体 最 初 被 指定 为 一 个 联系 。 因 为 动词 形式 的 联系 名 通常 要 转换 





成 为 名 词 形 式 的 实体 名 (动词 的 ing 形 式 )， 所 以 关联 实体 有 了 时 以 动 名 词 形式 表示 。 注 意 ， 在 图 3- 
lib 中， 在 关联 实体 和 强 实体 的 连 线 中 没有 用 姜 形 表示 的 联系 。 这 是 因为 关联 实体 表示 联系 。 

在 下 面 四 种 情况 中 ， 需 要 将 联系 转化 为 关联 实体 类 型 。 

1) 所 有 参与 实体 类 型 的 联系 都 是 “多 ”联系 。 

2) 对 最 终 用 户 来 说 ， 关 联 实体 类 型 具有 独立 的 意义 ， 最 好 用 单 值 属性 作为 标识 符 。 

3) 除了 标识 符 外 ， 关 联 实体 还 有 其 他 一 个 或 多 个 属性 。 

4) 关联 实体 参与 一 个 到 多 个 联系 ， 这 些 联系 独立 于 与 关联 联系 相关 的 实体 。 

图 3-11b 表 示 联 系 Completes 转 换 为 关联 实体 类 型 。 在 这 种 情况 下 ， 公 司 的 培训 部 将 决定 给 
学 完 课程 的 员工 授予 证 书 。 因 此 ， 这 个 实体 被 命名 为 CERTIFICATE， 该 实体 对 最 终 用 户 来 说 
显然 具有 独立 含义 。 每 一 个 证 书 以 证 书 编号 (Certificate_Number) 作为 标识 符 ， 该 实体 类 型 还 
包括 属性 Date_Completed (完成 日 期 )。 

注意 ， 由 于 将 联系 转化 为 关联 实体 需 移 动 表 示 该 联系 的 符号 。 这 就 是 说 ， 基 数 “多 ”在 关 
联 实体 处 中 止 ， 而 不 是 在 每 个 参与 实体 类 型 处 中 止 。 在 图 3-11 中 ， 这 表示 一 个 完成 一 到 多 门 课 
程 (图 3-11a 中 的 符号 A) 的 员工 可 能 被 授予 一 至 多 个 证 书 (图 3-1lb 中 的 符号 A)。 同 时 ， 既 然 
可 以 有 一 至 多 个 员工 结束 同一 门 课程 (图 3-11a 中 的 符号 B )， 那 么 也 可 以 给 一 至 多 个 员工 授予 


该 门 课程 的 证 书 (图 3-11b 中 的 符号 B)。 
oe | 


EMPLOYEE [DS 


Employee_ID Employee_Name 
EMPLOYEE 


3.6.2 联系 的 度 

度 (degree) 是 参与 联系 的 实体 类 型 的 个 数 。 在 图 3-11b 中 ， 因 为 有 两 个 实体 类 型 
(EMPLOYEE 和 COURSE) 参与 联系 ， 所 以 联系 Completes 的 度 为 2。 在 E-R 中 最 常见 的 联系 的 
度 有 一 元 (度数 为 1 )、 二 元 (度数 为 2) 和 三 元 (度数 为 3)。 更 高 度数 的 联系 也 是 可 能 的 ， 但 
在 实践 中 很 少见 ， 所 以 本 章 仅 讨论 三 元 以 内 的 联系 。 图 3-12 是 一 元 、 二 元 和 三 元 联系 的 例子 。 






Date_Completed 























Completes 












b) 关联 实体 (CERTIFICATE ) 


图 3-11 关联 实体 
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在 图 3-12 中 ， 任 何 一 个 数据 模型 都 表示 一 种 特定 的 情况 ， 而 不 是 一 般 情况 。 例 如 ， 考 察 图 
3-12a 中 的 Manages 联 系 。 在 某 些 组 织 中 ,一 个 员工 可 能 会 被 许多 其 他 员工 管理 (例如 在 第 阵型 
组 织 中 )。 根 据 这 些 情况 开发 E-R 模 型 时 ， 必 须要 理解 该 组 织 的 业务 规则 。 


小 
一 对 多 


a) 一 多 联系 


EMPLOYEE PARKING PLACE 















Shipping_mode 


c) 元 联系 
图 3-12 具有 不 同 度 的 联系 示例 
1. 一 元 联系 
一 元 联系 《unary relationship) 是 指 同一 实体 类 型 的 不 同 实例 之 间 的 联系 (一 元 联系 也 被 








称 为 递归 联系 )。 图 3-12a 中 是 两 个 一 元 联系 的 例子 。 在 第 一 个 例子 中 , “Is_married_to” (与 某 
人 有 婚姻 关系 ) 表示 为 实体 类 型 PERSON 的 两 个 实例 之 间 的 一 对 一 联系 。 因 为 是 一 对 一 联系 ， 
所 以 该 符号 只 表示 一 个 人 当前 的 婚姻 状况 应 该 保存 下 来 。 在 第 二 个 例子 中 ,“Manages” 是 实 
体 类 型 EMPLOYEE 的 实例 之 间 的 一 对 多 联系 。 利 用 这 个 联系 ， 能 够 确定 一 个 特定 管理 者 管理 
的 全 部 员工 。( 注意 ， 如 图 3-2 所 示 ， 在 这 些 例子 中 ， 均 忽略 这 些 联系 是 否 是 强制 的 还 是 可 选择 
的 。 本 章 下 一 节 将 介绍 这 些 概念 .) 

图 3-13 显 示 另 一 个 一 元 联系 的 例子 : 材料 单 结构 。 许 多 成 品 由 装配 件 构成 ， 而 装配 件 又 由 
更 小 的 零件 和 部 件 组 成 。 在 3-13a 中 ， 使 用 多 对 多 的 一 元 联系 来 表示 这 个 结构 。 实 体 类 型 ITEM 
用 于 表示 各 种 类 型 的 组 成 部 分 ， 联 系 类 型 的 名 字 是 “Has_components” (拥有 组 件 )， 用 来 将 上 
一 层 装 配 结构 和 下 一 层 装 配 结构 关联 起 来 。 

图 3-13b 是 材料 单 结构 的 两 个 实例 。 其 中 的 每 一 个 图 都 显示 装配 结构 中 的 直接 下 层 组 件 及 
其 数量 。 例 如 ， 标 准 件 X 包 括 标准 件 U (数量 为 3) 和 标准 件 V (数量 为 2)。 可 以 很 容易 确定 其 
联系 是 多 对 多 联系 。 许 多 装配 结构 中 有 多 种 类 型 的 组 件 ( 例 如， 标准 件 A 有 三 个 直接 下 层 组 件 ， 
即 X、V 和 Y)。 同 样 ， 其 中 一 些 组 件 又 可 用 于 多 个 上 层 装 配件 的 组 装 。 例 如 ， 标 准 件 X 可 同时 
用 于 组 装 标准 件 A 和 B。 多 对 多 的 联系 可 以 确保 在 标准 件 X 用 于 构建 其 他 标准 件 时 总 会 用 到 X 的 
部 件 结构 。 

在 联系 中 出 现 属性 Quantity (数量 )， 这 表示 分 析 员 将 把 联系 “Has_Components” 转 换 为 
关联 实体 。 图 3-13c 中 显示 实体 类 型 BOM_STRUCTURE， 该 实体 类 型 构成 了 ITEM 实 体 类 型 的 
不 同 实例 之 间 的 关联 。BOM_STRUCTURE 中 还 有 一 个 属性 Effective_Date 用 以 记录 该 组 件 第 
一 次 用 于 装配 的 日 期 。 如 需要 阀 的 历史 记录 时 ， 会 需要 这 个 表示 生效 时 间 的 属性 。 

2. 二 元 联系 

二 元 联系 (binary relationship) 是 两 个 实体 类 型 的 实例 之 间 的 联系 ， 这 是 数据 建 模 中 最 常 
见 的 一 种 联系 。 图 3-12b 是 三 个 二 元 联系 的 例子 。 第 一 个 例子 (一 对 一 联系 ) 指出 给 一 个 员工 
分 配 一 个 停车 点 ， 而 且 一 个 停车 点 只 能 分 配给 一 个 员工 。 第 二 个 例子 (一 对 多 联系 ) 指出 一 个 
产品 系列 可 以 包含 许多 种 产品 ， 而 一 个 产品 只 属于 一 个 产品 系列 。 第 三 个 例子 (多 对 多 联系 ) 
显示 每 个 学 生 可 以 注册 多 门 课程 ， 而 每 一 门 课程 都 可 以 由 许多 学 生 注 册 。 

3. 三 元 联系 

三 元 联系 (ternary relationship) 是 同 时 存在 于 三 个 实体 类 型 的 实例 之 间 的 联系 。 一 个 典型 
的 三 元 联系 例子 如 图 3-12c 所 示 。 在 这 个 例子 中 ， 供 货 商 能 够 给 仓库 提供 多 种 零件 。 联 系 
Supplies (供应 ) 用 来 记录 这 样 的 业务 规则 : 一 个 特定 的 零件 由 一 个 给 定 的 供 货 商 提 供给 一 个 
特定 的 仓库 。 在 此 出 现 三 个 实体 类 型 : VENDOR、PART 和 WAREHOUSE， 在 联系 Supplies 中 
有 两 个 属性 : Shipping_Mode (运输 方式 ) 和 Unit_Cost (单价 )。 联系 Supplies 的 一 个 实例 记录 
下 述 事实 : 供 货 商 X 可 以 运送 零件 C 到 仓库 Y， 货运 方式 为 隔日 航空 运输 ， 费 用 为 每 单位 5 美元 。 

注意 ， 一 个 三 元 联系 和 三 个 二 元 联系 是 不 等 价 的 。 例 如 ， 图 3-12c 中 ，Unit_Cost 是 Supplies 
联系 的 一 个 属性 。 三 个 实体 类 型 可 以 形成 三 个 二 元 联系 ， 但 属性 Unit_Cost 不 能 正确 地 关联 到 其 
中 任意 一 个 二 元 联系 中 (例如 在 PART 和 WAREHOUSE 之 间 )。 如 果 我 们 说 供 货 商 X 能 以 每 单位 8 
美元 的 价格 运送 零件 C， 但 由 于 没有 指出 要 将 零件 送 至 哪 一 个 仓库 ， 所 以 数据 仍然 是 不 完整 的 。 

在 图 3-12c 中 ， 由 于 在 联系 Supplies 中 出 现 一 个 属性 ， 所 以 通常 提示 设计 者 应 该 将 该 联系 转 
化 成 一 个 相关 的 实体 类 型 。 图 3-14 是 和 图 3-12c 等 价 的 另 一 种 三 元 联系 的 表示 形式 。 在 图 3-14 中 ， 
(关联 ) 实体 类 型 SUPPLY SCHEDULE 代 赫 了 图 3-12c 中 的 联系 Supplies。 很 明显 ， 用 户 需 要 独 
立 的 实体 类 型 SUPPLY SCHEDULE。 然 而 要 注意 ，SUPPLY SCHEDULE 中 还 没有 标识 符 ， 这 
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是 允许 的 。 如 果 在 E-R 建 模 中 ， 还 没有 为 一 个 关联 实体 类 型 指定 标识 符 ， 那 么 在 逻辑 建 模 过 程 
中 将 会 指定 一 个 标识 符 (或 键 )， 这 将 在 第 6 章 中 讨论 。 该 标识 符 是 一 个 复合 标识 符 ， 其 组 成 部 
分 包括 每 一 个 参与 联系 的 实体 类 型 的 标识 符 。 在 本 例 中 ， 关 联 实体 SUPPLY SCHEDULE 的 标 
识 符 是 由 实体 类 型 PART、VENDOR 和 WAREHOUSE 的 标识 符 所 组 成 的 复合 标识 符 。 你 还 能 想 


出 SUPPLY SCHEDULE 的 其 他 属性 吗 ? 
Has_ 
components 


小 
号 
V 
a) 多 对 多 联系 




















b) 两 个 实例 
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Used in_assemblies 





c) 关联 实体 
图 3-13 一 份 材料 单 的 结构 
在 图 3-14 中 没有 使 用 菱形 符号 ， 而 是 直接 用 线 连 接 SUPPLY SCHEDULE 和 二 个 实体 。 这 是 


因为 这 些 线 表示 的 不 是 二 元 联系 。 为 了 完整 、 准 确 地 表达 图 3-12c 中 三 元 联系 的 含义 ， 不 能 将 
Supplies 联 系 分 解 成 三 个 二 元 联系 。 








本 书 强烈 建议 读者 像 该 例 一 样 ， 把 所 有 三 元 (或 更 高 ) 联系 转换 为 关联 实体 。Song、 
Evans 和 Park ( 1995) 认为 使 用 本 章 中 符号 ， 不 能 精确 地 表示 三 元 联系 中 的 参与 约束 (在 下 一 
节 讲 述 )。 然 而 ， 通 过 转换 为 关联 实体 ， 就 能 精确 表示 约束 。 另 外 ,包括 大 多 数 CASE 工 具 在 内 ， 
许多 E-R 图 绘制 工具 不 能 表示 三 元 联系 。 所 以 ， 尽 管 在 语法 上 不 准确 ， 有 时 需要 用 一 个 关联 实 
体 和 三 个 二 元 联系 来 表示 三 元 联系 。 









WAREHOUSE 








Shipping_mode 


图 3-14 关联 实体 形式 的 三 元 联系 


3.6.3 属性 还 是 联系 

图 3-15 给 出 三 种 通过 联系 描述 属性 的 情况 。 在 图 3-15a 中 ， 一 门 课程 的 预备 课程 也 是 课程 的 
形式 ， 同 时 一 门 课程 也 可 以 作为 其 他 许多 课程 的 预备 课程 。 所 以 ， 预 备课 程 可 视 为 课程 之 间 的 
一 个 一 元 联系 ， 而 不 是 COURSE 的 多 值 属 性 。 通 过 一 元 联系 表示 预备 课程 也 意味 着 ， 查 找 一 门 
课程 的 预备 课程 和 查找 一 门 课程 的 后 续 课 程 都 能 够 以 实体 类 型 间 联 系 的 方法 来 处 理 。 如 果 把 预 
备课 程 作为 COURSE 的 多 值 属性 ， 查 找 一 门 课程 的 后 续 课程 方法 是 : 遍历 所 有 COURSE 实 例 ， 
以 查找 预备 课程 为 该 课程 的 实体 实例 。 在 图 3-15b 中 ， 员 工具 备 技能 ， 但 是 技能 也 可 以 作为 一 
个 实体 类 型 ， 因 为 技能 也 是 组 织 所 感 兴趣 的 、 具 有 独立 含义 的 数据 对 象 。 技 能 的 属性 包括 技能 
的 简单 描述 和 技能 类 型 ， 如 技术 或 管理 。 员 工 有 技能 ， 但 不 作为 属性 ， 而 是 作为 相关 实体 类 型 
的 实例 。 但是， 在 有 些 人 看 来 ， 在 图 3-15a 和 3-15b 所 示 的 情况 中 ， 多 值 属性 比 实体 类 型 更 合适 ， 
这 种 做 法 可 以 简化 E-R 图 。 

那么 ， 在 什么 情况 下 ， 应 该 将 一 个 属性 通过 联系 链接 到 实体 类 型 呢 ? 答案 是 : 如果 属 性 是 
标识 符 或 数据 模型 中 实体 类 型 的 其 他 特征 ， 同 时 该 属性 被 多 个 实体 实例 共享 ， 则 需要 进行 这 种 
转化 。 图 3-15c 给 出 这 条 规则 的 例子 。 在 这 个 例子 中 ，EMPLOYEE 有 一 个 复合 属性 Department 
(部 门 )。 因 为 Department 表 示 业 务 中 的 一 个 完整 概念 ,并 且 有 多 个 员工 需 共 享 相同 的 部 门 数据 ， 
所 以 应 该 没有 宛 余地 在 实体 类 型 DEPARTMENT 中 表示 部 门 数 据 ， 并 通过 部 门 的 有 关 数 据 与 其 
他 实体 类 型 建立 联系 。 通 过 这 种 方法 ， 不 但 不 同 的 员工 可 以 共享 相同 的 部 门 数据 ， 而 旦 分 配给 
部 门 的 多 个 项 目 和 部 门 中 的 各 工作 组 都 可 以 共享 相同 的 部 门 数据 。 
3.6.4 基数 约束 

假定 有 两 个 实体 类 型 A 和 B ， 它 们 通过 联系 相连 接 。 基 数 约束 (cardinality constraint) 指定 
对 于 实体 A 的 每 个 实例 ， 有 多 少 个 实体 B 的 实例 可 能 (或 必须 ) 与 之 关联 。 例 如 ， 考 虑 一 个 出 
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租 电影 录像 带 的 音像 店 。 这 个 音像 店 可 以 保存 一 部 影片 的 多 盘 录 像 带 ， 即 图 3-16a 所 示 的 “一 
对 多 ”联系 。 当 然 ， 在 某 一 段 时 间 ， 店 里 可 能 没有 一 盘 该 影片 的 录像 带 (如 所 有 录像 带 都 被 借 
出 )。 我 们 应 该 引入 一 种 更 精确 的 符号 来 指出 联系 中 基数 的 范围 。 在 图 3-2 中 已 经 出 现 过 这 个 符 
号 ， 现 在 读者 需要 复习 一 下 。 

属性 联系 


小 
V 






Course_Title 










COURSE 


a) 多 值 属性 与 联系 





b) 复合 属性 、 多 值 属性 与 联系 





c) 由 其 他 实体 类 型 共享 的 数据 的 复合 属性 
图 3-15 使 用 联系 链接 有 关 属 性 





1. 最 小 基数 

联系 的 最 小 基数 (minimum cardinality ) 是 实体 B 的 实例 可 以 和 实体 A 的 每 个 实例 相关 联 的 
最 小 个 数 。 在 上 面 所 说 的 录像 带 的 例子 中 ， 对 于 一 部 影片 来 说 ,录像 带 的 最 小 数目 为 0。 当 参 
与 的 最 小 数目 为 0 时 ， 我 们 说 参与 联系 的 实体 B 是 可 选 的 。 本 例 的 “Is_stocked_as” 联 系 中 的 
VIDEOTAPE 是 可 选 的 。 在 图 3-16b 中 ， 从 VIDEOTAPE 发 出 的 带 “0” 一 个 箭头 符号 表示 这 个 事 

2. 最 大 基数 

联系 的 最 大 基数 (maximum cardinality) 是 实体 B 的 实例 可 以 和 实体 A 的 一 个 实例 相 联 系 的 
最 大 个 数 。 在 上 面 所 说 的 录像 带 的 例子 中 ， 对 于 VIDEOTAPE 实 体 ， 其 最 大 基数 为 “多 ”， 即 大 
于 一 的 一 个 木 确定 的 数字 。 在 图 3-16b 中 ， 从 VIDEOTAPE 发 出 的 带 有 “ 鸟 爪 ”符号 的 - -个 箭头 
表示 这 个 事实 。 


 . 了] VIDEOTAPE 


a) 基本 联系 


Copy_Number 
VIDEOTAPE 


b) 带 有 基数 约束 的 联系 
图 3-16 基数 约束 

联系 是 双向 的 ， 所 以 在 MOVIE 实 体 旁 也 有 一 个 基数 符号 。 注 意 ， 其 最 大 基数 与 最 小 基数 
都 是 1， 如 图 3-16b 所 示 ， 这 称 为 强制 ! (mandatory one) 的 基数 。 也 就 是 说 ， 每 盘 录 像 带 只 能 
是 一 部 影片 的 拷贝 。 参 与 联系 的 实体 可 以 是 可 选 的 ， 也 可 以 是 强制 的 。 如 果 最 小 基数 为 0， 则 
参与 是 可 选 的 ; 如 果 最 小 基数 为 1， 则 参与 是 强制 的 。 

如 图 3-16b 所 示 ， 每 个 实体 类 型 中 都 添加 了 -- 些 属性 。 注 意 ，VIDEOTAPE 表 示 为 一 个 弱 实 
体 类 型 。 这 是 因为 如 果 相 应 的 影片 不 存在 ， 则 录像 带 也 不 会 存在 。MOVIE 的 标识 符 是 
Movie_Name (影片 名 )。VIDEOTAPE 没 有 惟一 的 标识 符 ， 但 是 Copy_Number (拷贝 名 ) 是 一 
个 部 分 标识 符 ， 这 个 部 分 标识 符 与 Movie_Name 组 合 ， 即 可 惟一 确定 VIDEOTAPE 的 一 个 实例 。. 

3. 例子 ; 

在 图 3-17 中 ， 显示 了 最 大 与 最 小 基数 的 所 有 组 合 的 例子 。 每 个 例子 声明 一个 基数 约束 的 业 
务 规则 ， 并 给 出 相应 的 E-R 符 号 。 同 时 还 给 出 一 些 联系 的 实例 以 阐明 联系 的 本 质 。 读者 应 认真 
研究 每 个 例子 。 以 下 是 图 3-17 中 每 个 例子 的 业务 规则 : 

1) PATIENT Has PATIENT HISTORY (参见 图 3-17a)。 每 个 病人 有 一 个 至 多 个 病历 (如 时 
病人 是 第 一 次 看 病 ， 将 产生 他 的 PATIENT HISTORY 的 第 一 个 实例 )。PATIENT HISTORY 的 一 






Ce 一 | 
| 
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个 实例 仅 “ 属 于 ”一 个 PATIENT.。 

2) EMPLOYEE Is_assigned_to PROJECT (参见 图 3-176)。 每 个 PROJECT 中 至 少 有 一 个 
EMPLOYEE (有 些 项 目 可 以 有 多 名 员工 )。 每 个 EMPLOYEE 有 可 能 (可 选 的 ) 分 配 到 一 个 已 
有 的 PROJECT 中 (例如 ， 员 工 “Pete”)， 也 可 能 分 配 到 一 个 或 多 个 项 目 中 。 

3) PERSON Is_married_to PERSON (参见 图 3-17c)。 因 为 某 个 人 可 能 已 婚 也 可 能 未 婚 ， 所 
以 该 联系 的 两 个 方向 的 基数 都 是 可 选 的 (0 或 1 )。 

最 大 基数 可 能 是 一 个 固定 的 值 ， 而 不 是 一 个 模糊 的 “多 ” 值 。 例 如 ， 有 一 项 企业 制度 规定 
一 个 员工 最 多 可 以 同时 在 5 个 项 目 中 工作 ， 那 么 在 图 3-17b 中 ， 可 以 通过 在 PROJECT 旁 的 鸟 爪 符 
号 的 上 方 或 下 方 写 上 数字 5 来 表示 这 个 业务 规则 。 


E Mark Visit 1 

A PATIENT 

PATIENT HN HISTORY Sarah 一 一 Visit1 
arah 一 visit 2 














Elsie Visit 1 
a) 强制 基数 
Rose We BPR 
EMPLOYEE [>>Is_assigned to>G< 培 PROJECT Pete 
TQM 
Debbie 
OO 
Tom < 
Heidi CR 
b) -一 个 方向 可 选 ， 另 -个 方向 为 强制 的 基数 
| Shirley 
十 | Mack 
Dawn 
PERSON Is_married_to 
Kathy 
| Ellis 
中 ; 
| Fred 
c) 可 选 基数 


图 3-17 基数 约束 的 例子 
4. 一 个 三 元 联系 
图 3-14 中 给 出 一 个 带 有 关联 实体 SUPPLY SCHEDULE 的 三 元 联系 ， 本 节 将 基于 相关 业务 规 
则 在 该 图 中 加 入 基数 约束 。 修改 后 的 E-R 图 和 相关 的 业务 规则 如 图 3-18 所 示 。 注 意 ，PART 和 
WAREHOUSE 强 制 参 与 到 联系 中 ， 而 VENDOR 则 是 可 选 的 。 因 为 每 个 SUPPLY SCHEDULE 实 
例 必须 与 这 些 参 与 实体 类 型 的 一 个 实例 相 联系 ， 所 以 每 个 参与 实体 的 基数 都 强制 为 1 
如 前 所 述 ， 一 个 三 元 联系 不 等 价 于 三 个 二 元 联系 。 但 是 ， 许多 CASE 工 具 中 不 提供 绘制 三 元 





联系 的 机 制 ， 所 以 ， 读 者 不 得 不 先 将 一 个 三 元 联系 转化 为 三 个 二 元 联系 。 如 果 必 须 这 样 做 ， 那 

么 注意 ， 在 每 个 二 元 联系 中 不 要 用 菱形 符号 表示 联系 ， 并 确保 三 个 强 实体 类 型 的 基数 强制 为 1。 

业务 规则 

Q@ 每 个 供 货 商 可 以 向 任意 
多 个 仓库 提供 许多 零件 ， 
但 也 可 能 不 提供 零件 。 

@ 每 个 零件 可 以 由 任意 多 

人) 个 供 货 商 提供 给 多 个 仓 


库 ， 但 每 个 零件 必须 由 
A 至 少 一个 供 货 商 提供 给 
SUPPLY .个 仓库 。 
VENDOR SCHEDULE WAREHOUSE 
@ 每 个 仓库 可 以 从 多 个 供 
Shipping_mode 
图 3-18 三 元 联系 中 的 基数 约束 


货 商 处 获 到 任意 数 旺 的 
零件 ， 但 是 第 个 仓库 必 
须 获 取 笃 少 个 零件 。 
3.6.5 建立 依赖 于 时 间 的 数据 模型 
数据 库 的 内 容 是 随时 变化 的 。 例 如 ， 在 数据 库 中 存储 着 产品 信息 。 因 为 原材料 价格 、 劳 动 
力 的 价格 以 及 市 场 是 变化 的 ， 所 以 产品 的 单价 也 会 发 生变 化 。 如 果 仅 需要 当前 的 单价 ， 可 在 建 
模 时 将 Price 作 为 一 个 单 值 属性 。 但 是 ， 对 于 会 计 、 账 单 以 及 其 他 方面 的 要 求 来 说 ， 应 该 保留 单 
价 变化 的 记录 以 及 变化 生效 的 时 间 。 如 图 3-19 所 示 ， 可 以 将 这 些 需 求 概念 化 为 一 系列 价格 和 价 
格 生 效 日 期 。 这样 做 会 产生 名 为 Price_History 的 多 值 属 性 ， 其 组 成 部 分 有 Price 和 Effective_Date。 
在 这 个 复合 的 、 多 值 的 属性 中 ， 一 个 重要 特征 是 其 组 成 部 分 都 是 具有 内 在 联系 的 。 如 图 3-19 所 
示 ， 每 个 Price 与 相应 的 Effective_Date 成 对 出 现 。 
在 图 3-19 中 ， 每 个 Price 的 属性 值 都 是 带 有 代表 其 生效 日 期 的 时 间 戳 。 时 间 惟 (time stamp ) 
是 一 个 与 数据 值 相关 联 的 时 间 值 (如 日 期 和 时 间 )。 如 果 需 要 维护 数据 值 的 历史 记录 ， 那 么 可 


将 时 间 愉 与 任何 随时 间 变 化 的 数据 值 相 关 
联 。 时 间 葵 记录 可 以 指出 数据 值 输入 的 时 间 

Effective_Date 
品 组 ) 中 。 公司 要 年 复 一 年 地 处 理 顾 客 订单 ， 


(事务 处 理 时 间 )， 值 合法 存在 的 时 间 和 变 为 
非法 的 时 间 ， 以 及 执行 某 些 临 界 动作 的 时 间 ， 
Er 
并 按 月 提交 产品 系列 和 产品 系列 中 各 个 产品 、 
的 汇总 。 图 3-19 简单 时 间 发 的 例子 



















(如 更 新 、 更 正和 审计 等 )。 

简单 时 间 规 (如 前 面 的 例子 ) 通常 可 以 
满足 为 依赖 于 时 间 的 数据 建 模 的 要 求 .但 是 ， 
时 间 常 常会 使 数据 建 模 变 得 复杂 。 例 如 ， 图 
3-20a 显 示 松 谷 家 具 公司 E-R 图 的 一 部 分 ， 每 
个 产品 都 分 配 到 一 个 产品 系列 (或 相关 的 产 
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PRODUCT 
LINE 
小 
PRODUCT 
PRODUCT 
LINE 
小 
PRODUCT 


假设 在 年 中 , 由 于 需要 对 销售 进行 重新 组 织 ， 所 以 一 些 产品 被 重新 分 配 到 其 他 产品 系列 上 。 
图 3-20a 中 的 模型 没有 考虑 这 一 因素 。 于 是 ， 所 有 的 销售 报告 反应 的 销售 合计 都 是 基于 产品 的 
当前 产品 系列 ， 而 不 是 产品 销售 时 的 产品 系列 。 例 如 ， 在 销售 报告 中 可 能 反应 : 本 年 初 到 目前 
为 止 ， 产品 系列 B 上 的 某 种 产品 的 销售 累计 为 50 000 美 元 ， 但 实际 上 产品 系列 B 中 的 该 产品 销售 
了 40 000 美 元 后 ， 该 产品 已 经 重新 分 配 到 产品 系列 A 中 了 。 在 图 3-20a 的 模型 中 显然 遗漏 了 这 个 
事实 。 在 图 3-20b 中 ， 对 原 有 设计 进行 了 一 些 简单 的 改动 ， 即 可 表示 这 一 事实 。 在 ORDER 和 
PRODUCT LINE 中 间 增 加 了 一 个 新 的 联系 ( 即 Sales_for_product_line ) 。 当 处 理 顾 客 订 单 时 ， 
同时 确认 订单 上 的 产品 在 销售 时 所 在 的 产品 系列 。 

本 书 作者 曾经 与 许多 组 织 中 的 管理 者 讨论 关于 时 间 依 赖 数据 的 问题 . 对 于 数据 建 模 和 数据 












a) 不 含 产品 重新 分 配 因 素 的 E-R 鲜 












Sales_ for_product_ jine 









Sales_for_product 


b) 包含 产品 重新 分 配 因素 的 E-R 图 
图 3-20 松 谷 家 具 公 司 的 产品 数据 库 








库 管 理 ， 这 些 管理 者 拥有 丰富 的 经 验 。 通过 讨论 ， 作 者 发 现 ， 现 有 的 数据 模型 (以 及 基于 这 些 
模型 的 数据 库 管理 系统 ) 在 处 理 具 有 时 间 依赖 关系 的 数据 方面 的 能 力 是 不 够 的 , 在 数据 建 模 中 ， 
人 们 一 般 忽略 这 个 问题 ， 并 希望 这 些 不 精确 之 处 能 够 互相 抵消 。 但 是 ， 在 数据 仓库 中 ， 通 过 对 
依赖 时 间 的 数据 进行 显 式 地 建 模 ， 可 以 消除 这 些 不 确定 性 。 在 设计 依赖 时 间 的 数据 模型 时 ， 读 
者 应 对 其 中 的 复杂 性 给 予 充 分 重视 。 
3.6.6 实体 之 间 的 多 种 联系 

在 某 些 特殊 情况 下 ,需要 对 同样 的 实体 类 型 建立 多 种 联系 。 图 3-21 是 这 种 情况 的 两 个 例子 。 
在 图 3-21a 中 ， 实 体 类 型 EMPLOYEE 和 DEPARTMENT 之 间 有 两 种 联系 。 联 系 Works_in 将 员工 
与 其 所 在 部 门 关联 起 来 ， 这 个 联系 是 一 个 一 对 多 联系 ， 并 是 双向 强制 的 。 也 就 是 说 ， 一 个 部 门 
至 少 必须 有 一 个 员工 (可 能 是 经 理 )， 而 一 个 员工 必须 被 分 配 到 某 一 个 部 门 中 (只 能 分 配 到 一 
个 部 门 )。 注 意 ， 此 处 为 了 说 明 多 个 联系 的 问题 而 规定 这 个 特定 的 业务 规则 。 理 解 业 务 规则 对 
于 设计 E-R 图 是 至 关 重 要 的 。 例 如 ， 如 果 EMPLOYEE 包 括 退 休 员 工 ， 则 “每 个 员工 必须 被 分 配 
到 一 个 部 门 中 ”这 条 业务 规则 就 不 适用 。 另 外 ， 图 3-21a 中 的 E-R 模 型 假定 组 织 只 需 存 储 每 个 
EMPLOYEE 当 前 工作 的 DEPARTMENT， 而 不 需 存 储 人 员 分 配 的 历史 记录 。 数 据 模型 的 结构 反 


瑞 组 织 应 该 存储 的 信息 结构 。 
人 小 
V 


a) 员工 和 部 门 


ls_qualified 
ls_scheduled 


b) 教授 和 课程 (增加 了 约束 ) 
图 3-21 多 种 联系 的 例子 
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EMPLOYEE 和 DEPARTMENT 之 间 的 第 二 个 联系 是 “Manages"， 它 将 每 个 部 门 和 管理 部 门 
的 员工 关联 起 来 。 该 联系 在 从 DEPARTMENT 到 EMPLOYEE 的 方向 上 是 强制 为 1 的 关系 ， 表 示 
一 个 部 门 必 须 由 且 仅 由 一 名 经 理 管理 ; 但 从 EMPLOYEE 到 DEPARTMENT 方向 是 可 选 为 1 的 关 
系 ， 表 示 并 不 是 所 有 的 员工 都 是 经 理 。 

图 3-21a 是 一 个 一 元 联系 Supervises ， 它 将 每 个 员工 与 他 的 主管 人 联系 起 来 ， 反 之 亦 然 。 这 
个 联系 说 明 下 述 业 务 规则 : 每 个 员工 有 且 仅 有 一 名 主管 人 。 反 过 来 ， 一 名 员工 可 以 主管 任意 数 
量 的 员工 ， 他 也 可 能 根本 不 是 主管 。 

图 3-21b 中 显示 实体 类 型 PROFESSOR 和 COURSE 之 间 的 两 个 联系 。 联 系 Is_qualified 表 示 教 
师 有 资格 讲授 某 门 课程 。 可 能 会 有 多 名 教师 有 资格 讲授 某 一 门 课程 ， 但 也 可 能 (可 选 的 ) 没有 
一 名 教师 有 资格 讲授 该 门 课 程 。 如 果 某 门 课程 是 新 开设 的 课程 并 且 刚刚 加 入 学 校 的 教学 计划 ， 
则 可 能 会 出 现 没有 教师 有 资格 讲授 这 个 课程 的 情况 。 另 一 方面 ， 每 个 教师 必须 至 少 有 讲授 一 门 
课程 的 资格 。( 合理 要 求 ! ) 

图 中 的 第 二 个 联系 将 教师 及 其 在 某 个 学 期 所 要 讲授 的 课程 联系 起 来 。 注意, 在 一 个 学 期 中 ， 
教师 讲授 课程 的 最 大 基数 是 4。 这 是 一 个 在 E-R 图 中 记录 固定 约束 (最 大 或 最 小 ) 的 例子 。 联 
系 Is_scheduled (计划 ) 有 一 个 属性 Semester (学 期 )， 这 是 一 个 由 Semester_Name 和 Year 组 成 
的 复合 属性 。 

在 图 3-21b 的 E-R 图 中 ， 可 以 看 出 基本 的 基数 约束 。 但 在 一 般 情 况 下 ， 在 一 个 基本 的 E-R 图 
中 浮 找 业务 规则 并 不 容易 。 考 虑 图 3-2lib 中 的 下 列 规则 : 如 果 教 师 被 安排 讲授 一 门 课程 ， 则 他 
必须 首先 具有 讲授 这 门 课程 的 资格 。( 另 一 个 合理 的 要 求 ! ) 这 条 规则 就 难以 从 E-R 图 中 直接 找 
到 。 在 第 4 章 中 ， 将 讨论 从 整个 建 模 过 程 中 寻找 业务 规则 的 方法 。 

3.6.7 命名 和 定义 联系 

除了 命名 数据 对 象 的 一 般 原 则 外 ， 下 面 还 列 出 一 些 专用 于 命名 联系 的 原则 : 

“联系 名 应 是 一 个 动词 短语 ， 如 Assigned_to、Supplies 或 Jeaches 等 。 联 系 表 示 要 采取 的 动作 ， 
通常 使 用 现在 时 。 联 系 名 说 明 要 采取 的 动作 ， 而 不 是 动作 的 结果 (如 Assigned_to 比 
Assignment 更 合适 )。 联 系 名 说 明 参 与 联系 的 实体 类 型 之 间 的 互相 作用 的 本 质 ， 而 不 是 所 涉及 
的 过 程 。( 例 如 ， 对 于 Employee 与 Project 之 间 的 联系 ， 联 系 名 Assigned_toFAssigning 更 合适 。) 
“应 避免 使 用 含义 不 清楚 的 名 字 ， 如 Has 或 1s_related_to 等 。 应 使 用 描述 性 的 动词 短语 ， 通 
常 可 以 从 联系 的 定义 中 找到 合适 的 描述 动作 的 短语 。 

以 下 是 一 些 用 于 定义 联系 的 特定 原则 : 

“ 联系 的 定 又 应 该 解释 发 生 什么 动作 以 及 这 个 动作 为 何 重要 。 在 某 些 情况 下 ， 指 出 实施 该 
动作 的 人 或 事件 也 是 比较 重要 的 。 但 是 ， 没 有 必要 描述 动作 怎样 发 生 。 可 以 说 明 联 系 中 
涉及 的 业务 对 象 。 但 是 ， 因 为 在 E-R 图 中 已 经 显示 联系 所 涉及 的 实体 类 型 ， 而 且 在 其 他 
地 方 也 可 以 找到 实体 类 型 的 定义 ， 所 以 没有 必要 描述 业务 对 象 。 

* 在 某 些 情况 下 ， 有 必要 给 出 阅 明 动作 内 容 的 例子 。 例 如 ， 对 于 在 学 生 和 课程 之 间 的 联系 
Registered_for， 应 该 解释 这 个 联系 同时 包括 现场 注册 和 在 线 注册 ， 也 包括 留级 学 期 和 复 
"定义 必须 解释 任何 可 选 参与 。 设 计 者 应 该 解释 这 些 问题 ， 在 什么 情况 下 会 产生 等 关联 实例 
(基数 为 0) ; 是 第 一 次 创建 实体 实例 时 会 产生 这 种 情况 ， 还 是 任何 时 候 都 有 可 能 发 生 这 种 
情况 。 例 如 ，“Registered_for 联 系 表示 学 生 与 课程 之 间 的 关系 ”。 一 门 课程 在 未 开课 之 前 没 
有 学 生 注册 ,但 是 也 可 能 从 未 有 过 学 生 注册 ; 学 生 在 课程 开课 之 前 不 能 注册 ， 但 是 也 可 能 
不 注册 任何 一 门 课程 (也 可 能 注册 了 课程 ， 然 后 未 通过 某 些 课程 或 所 有 课程 )。 








。 如果 联系 中 存在 显 式 定义 的 固定 基数 ， 则 需 在 联系 定义 中 进行 说 明 。 例 如 ，“Assigned_ 
to 联系 表示 员工 和 项 目 之 间 的 关系 ， 根 据 工 会 的 协议 ， 一 个 员工 同时 参加 的 项 目 不 能 超 
过 4 个 ”。 这 是 一 种 典型 的 描述 基数 上 界 的 业务 规则 ， 瞳 示 最 大 基数 可 能 发 生变 化 。 人 在 本 
例 中 ， 工 会 的 下 一 个 协议 可 能 改变 这 个 上 界 。 所 以 ， 在 实现 最 大 基数 时 ， 应 允许 最 大 基 
数 的 改动 。 

“联系 定义 中 应 解释 互 斤 联 系 。 互 斥 联系 是 指 下 述 情况: 实体 实例 可 以 参与 许多 联系 ， 但 
一 个 实体 实例 仅 能 同时 参与 其 中 的 - -个 联系 。 第 4 章 将 给 出 这 种 情况 的 例子 。 现 在 考虑 下 
面 这 个 例子 : “联系 Plays_on 表 示 校 际 运动 队 与 其 队员 的 关系 。 校 际 运动 队 中 的 学 后 队员 
不 能 同时 参与 学 校 中 的 其 他 兼职 工作 。 也 就 是 说 ，-- 个 学 生 不 能 通过 联系 Plays_on 与 校 
际 运 动 队 联 系 的 同时 又 通过 联系 Works_on 与 学 校 中 的 其 他 工作 相连 接 ”"。 另 一 个 互 斥 限 
制 的 例子 是 员工 实体 的 两 个 实例 之 间 不 能 则 时 存在 联系 Supervised_by 和 联系 Married_to。 

。 联 系 定义 中 应 解释 联系 的 参与 中 的 限制 关系 。 除 了 互 尺 这 种 限制 外 ， 还 有 其 他 许多 种 限 
制 。 例 如 ,“ 联 系 Supervised_by 表 示 员 工 与 其 下 属 员工 之 间 的 关系 以 及 员工 与 其 主管 之 间 
的 关系 。 一 个 员工 不 能 是 自己 的 主管 人 ; 职位 等 级 低 于 4 的 员工 也 不 能 成 为 主管 人 ”。 

。 联 系 定义 应 解释 联系 中 需 保留 的 历史 记录 的 范围 。 例 如 ,，“ 联 系 Assigned_to 表 示 病 床 与 
病人 之 间 的 关系 。 在 系统 中 只 需 保存 当前 的 病床 分 配 情况 。 如 果 病 人 没有 住院 ， 则 不 需 
分 配 病 床 ; 在 某 个 时 刻 ， 病 床 也 可 能 空闲 ”。 另 一 个 描述 联系 的 历史 记录 的 例子 是 “联系 
Places 表 示 顾 客 和 订单 之 间 的 关系 。 数 据 库 中 仅 存 储 两 年 内 的 订单 记录 。 所 以 ， 并 不 是 
所 有 的 订单 都 参与 联系 ”。 

“联系 定义 应 指出 是 否 一 个 联系 实例 中 的 实体 实例 可 以 转移 参与 到 另 一 个 联系 实例 中 。 例 
如 ,， “联系 Places 表 示 顾 客 和 订单 之 间 的 关系 ， 同 时 表示 订单 与 相关 顾客 之 间 的 关系 。 订 
单 不 能 转移 到 另 一 个 顾客 ”。 另 一 个 例子 是 “联系 Categorized_as 表 示 产 品系 列 与 该 系列 
中 产品 的 关系 ， 同 时 还 表示 产品 和 相关 产品 系列 之 间 的 关系 。 根 据 组 织 结构 的 变化 和 产 
品 的 设计 特性 ， 产 品 可 以 重新 归 类 到 另 一 个 产品 系列 中 。Categorized_as 只 保存 当前 的 产 
晶 系 列 和 产品 的 关系 ”。 


3.7 E-R 建 模 的 例子 : 松 谷 家 具 公司 


有 两 种 方法 可 用 于 开发 实体 -联系 图 。 使 用 自 顶 向 下 的 方法 ， 设 计 者 从 业务 的 基本 描述 开 
始 ， 包 括 其 制度 、 处 理 方法 和 环境 。 在 开发 高 层 E-R 图 时 ， 由 于 只 包括 主要 实体 和 联系 以 及 有 
限 的 属性 集合 (如 仅 有 标识 符 )， 所 以 使 用 这 种 方法 是 最 合适 的 。 使 用 自 底 向 上 的 方法 ， 设 计 
流程 从 与 用 户 讨论 细节 开始 ， 并 包括 对 文件 、 显 示 和 其 他 数据 源 的 细节 研究 。 这 种 方法 对 于 开 


发 一 个 详细 的 、“ 全 属性 ”的 E-R 图 来 说 是 必要 的 。 


在 本 节 中 ， 总 体 上 基于 第 一 种 方法 为 松 谷 家 具 公 司 开发 一 个 高 层 E-R 图 。 同 时 ， 以 用 户 发 
票 〈《 见 第 1] 章 ) 为 基础 并 增加 一 些 细节 数据 ， 描 述 如 何 将 这 两 种 方法 结合 使 用 。 
在 对 松 谷 家 具 公司 业务 流程 的 研究 中 ， 确 定 了 下 列 一 些 实体 类 型 。 在 每 个 实体 类 型 中 都 标 


出 了 标识 符 和 一 些 重要 的 属性 。 


"公司 销售 不 同 的 家 具 产 品 。 这 些 产 品 分 成 几 个 不 同 的 产品 系列 。 产 品 的 标识 符 是 
Product_ID， 产 品系 列 的 标识 符 是 Product_Line ID。 根据 图 1-6 的 用 户 发 票 ， 还 确定 出 产 
品 的 以 下 属性 : Product_Description、Product_Finish[ 人 及 Standard_PriceS。 产 品系 列 的 


昌 图 1-6 中 的 发 票 最 示 了 单价 ,但 选择 standard price 作 为 属性 名 。 因 为 将 来 的 单价 可 能 站 给 顾客 打折 后 的 价格 ， 
所 以 要 存储 标准 的 产品 价格 。 
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另 一 个 属性 是 Product_Line_Name。 一 个 产品 系列 可 以 包含 任意 多 种 产品 ， 但 是 必须 至 少 
包含 一 种 产品 。 每 个 产品 都 必须 属于 昌 仅 属于 一 个 产品 系列 。 

。 顾 客 提交 产品 订单 。 订 单 的 标识 符 是 Order_ID ， 另 一 个 属性 是 Order_Date 。 顾 客 可 以 提 
交 任 意 多 个 订单 ， 也 可 以 不 提交 任何 订单 。 每 个 订单 都 由 且 仅 由 一 个 顾客 提交 。 顾 客 的 
标识 符 是 Customer_ID， 其 他 属性 还 包括 Customer_Name、Customer_Address 和 
Postal_Code 。 

。 一 个 己 有 的 订单 必须 至 少 包括 一 种 产品 ， 并 且 对 于 订单 的 每 一 行 上 只 能 包括 一 个 产品 。 
松 谷 家 具 公 司 所 销售 的 产品 可 以 不 出 现在 任何 订单 上 ， 也 可 能 出 现在 一 个 或 多 个 订单 上 。 
与 每 个 订单 条 目 相 关 的 属性 是 Ordered_Quantity ， 表 示 需 要 的 数量 。 

。 松 从 家 具 公 司 已 经 为 其 顾客 建立 了 销售 区 域 网 络 。 每 个 顾客 和 一 个 或 多 个 销售 区 域 发 生 
业务 联系 。 销 售 区 域 的 标识 符 属性 为 Territory_ID， 还 有 一 个 属性 Territory_Name。 销 售 
区 域 可 以 和 一 个 或 多 个 顾客 发 生 业 务 联系 ， 但 也 可 能 不 和 任何 顾客 发 生 业 务 联系 。 

。 松 谷 家 具 公 司 有 许多 销售 员 。 销 售 员 的 标识 符 属 性 是 Salesperson_ID， 基 他 属性 还 包括 
Salesperson_Name、Salesperson_Telephone 以 及 Salesperson_Fax。 一 个 销售 员 仅 在 一 个 销 
售 区 域 工作 ， 而 一 个 销售 区 域 可 以 有 一 个 或 多 个 销售 员 在 工作 。 

*， 每 个 产品 都 是 由 一 定数 量 的 一 种 或 几 种 原材料 组 装 而 成 的 。 原 材料 实体 的 标识 符 是 
Material_ID， 其 他 属性 还 包括 Unit_of_Measure、Material_Name 、Standard_Cost。 每 种 原 
材料 可 以 参与 一 种 或 多 种 产品 的 组 装 ， 在 每 种 产品 中 每 种 原材料 的 数量 都 是 一 定 的 。 

。 原 材料 由 供 货 商 提供 。 供 货 商 的 标识 符 属性 为 Vendor_ID， 其 他 属性 还 包括 Vendor_Name 
和 Vendor_Address。 每 种 原材料 可 以 由 一 个 或 多 个 供 货 商 提供 。 每 个 供 货 商 可 以 提供 一 
种 或 多 种 原材料 ， 但 是 某 个 供 货 商 也 可 以 不 给 松 谷 家 具 公 司 提供 任何 原材料 。 供 货 商 和 
原材料 之 间 的 联系 有 一 个 属性 为 Supply_Unit_Price。 

*。 松 谷 家 具 公 司 已 经 建立 起 多 个 加 工 中 心 。 加 工 中 心 的 标识 符 属性 为 Work_Center_ID， 还 
有 一 个 属性 为 Work_Center_Location。 每 个 产品 都 可 以 由 一 个 或 多 个 加 工 中心 生 产 ， 而 一 
个 加 工 中 心 可 以 生产 多 种 产品 ， 也 可 以 不 生产 任何 产品 。 

“公司 有 100 多 名 员工 。 员 工 的 标识 符 属性 为 Employee_ID， 其 他 属性 还 包括 Employee_ 
Name、Employee_Address 和 Skill。 一 个 员工 可 以 具备 多 种 技能 。 每 个 员工 可 以 在 一 个 或 
多 个 加 工 中 心 工作 。 每 个 加 工 中 心 必须 至 少 有 一 名 员工 在 工作 ,但 是 也 可 以 有 任意 多 个 
员工 在 工作 。 ， 

“ 除 总 裁 外 ， 每 个 员工 有 且 仅 有 一 名 主管 ， 总 裁 没 有 主管 。 作 为 主管 的 员工 可 以 领导 任意 
多 个 员工 ,但 并 不 是 所 有 的 员工 都 是 主管 。( 注 意 ， 这 个 业务 规则 的 定义 不 是 很 明确 ， 但 
迄今 为 止 ， 在 E-R 图 中 引入 的 符号 都 掩盖 了 这 种 二 义 性 。 用 户 不 能 从 规则 或 图 中 得 知 某 
一 个 员工 是 手下 暂时 无 人 的 主管 ， 还 是 他 根本 不 是 一 名 主管 。 在 第 4 章 中 引入 的 符号 将 用 
于 淤 清 这 种 区 别 , ) 


3.8 松 谷 家 具 公司 的 数据 库 处 理 


图 3-22 中 E-R 图 用 于 为 松 谷 家 具 公 司 提供 数据 库 概 念 设计 。 通 过 与 数据 库 未 来 的 使 用 者 进 
行 交流 ， 检 查 设 计 质 量 对 于 数据 库 设计 是 很 重要 的 ， 其 中 一 个 重要 的 质量 检查 类 型 就 是 确定 
E-R 图 是 否 能 够 方便 满足 用 户 对 于 数据 或 信息 的 需求 。 松 谷 家 具 公 司 的 员工 可 能 会 有 许多 关于 
数据 检索 和 报告 的 需求 。 在 本 节 中 ， 将 描述 对 于 图 3-22 所 示 E-R 图 ， 如 何 通过 数据 库 处 理 来 满 
足 一 些 信息 需求 。 
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图 3-22 松 谷 家 具 公 司 的 E-R 图 
本 章 使 用 SQL 数据 库 处 理 语言 (在 第 7 章 和 第 8 章 中 详细 介绍 ) 来 表述 这 些 查 询 。 为 了 清楚 


地 理解 这 些 查询 ， 读 者 应 该 理解 在 第 5 章 中 介绍 的 概念 。 但 是 ， 本 章 中 的 一 些 简单 查询 能 够 帮 
助 读者 理解 数据 库 的 集合 运算 的 能 力 ， 也 为 读者 理解 第 5 章 以 及 以 后 各 章 中 所 介绍 的 SQL 查询 
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次 定 良好 的 基础 。 
3.8.1 显示 产品 信息 

许多 不 同 的 数据 库 用 户 需 要 查看 松 谷 家 有 具 公司 的 信息 数据 ， 例 如 ， 销 售 员 、 仓 储 经 埋 和 产 
品 经 理 。 一 个 典型 的 情况 是 : 推销 员 要 对 顾客 关于 某 类 产品 的 需求 及 时 反应 。 这 种 查询 的 例子 
如 下 : 

列 出 库存 的 各 种 计算 机 桌 的 所 有 细节 信息 。 

此 查询 所 涉及 的 数据 保存 在 PRODUCT 实 体 (如 图 3-22 所 示 ) 中 。 该 查询 遍历 这 个 实体 ， 
结果 显示 包含 “Computer Desk” 的 实体 的 所 有 属性 。 

该 查询 的 SQL 代码 是 : 

SELECT * 


FROM PRODUCT 
WHERE Product Description LIKE "Computer Desk%®"; 


该 查询 的 典型 的 输出 结果 及 形式 如 下 : 





Product_ID Product Description Product Finish Standard Price 
3 Computer Desk 48" Oak 375.00 
8 Computer Desk 64" Pine 450.00 


SELECT * FROM PRODUCT 要 求 显示 PRODUCT 实 体 的 所 有 属性 。WHERE 子 句 表示 将 显 
示范 围 限制 在 其 描述 以 短语 “Computer Deskg” 开 头 的 产品 中 。 
3.8.2 显示 顾客 信息 

在 组 织 中 ， 另 一 个 常用 的 查询 是 显示 有 关 松 谷 家 具 公 司 顾 客 的 信息 数据 。 销 售 区 域 经 理 对 
这 些 信息 特别 感 兴趣 。 下 面 是 一 个 销售 区 域 经 理 的 典型 查询 : 

列 出 在 Northwest 销 售 区 域 中 所 有 客户 顾客 的 细节 。 

该 查询 所 涉及 的 数据 保存 在 CUSTOMER 实 体 中 。 正 如 第 5 章 所 介绍 的 ， 当 图 3-22 所 示 的 
E-R 图 被 转化 为 一 个 能 通过 SQL 访 问 的 数据 库 时 ， 属 性 Territory_ID 将 被 加 到 CUSTOMER 实 体 
中 。 查 询 遍 历 该 实体 并 显示 处 于 所 选 范围 内 的 顾客 的 所 有 属性 。 


该 查询 的 SQL 代码 如 下 : 
SELECT * 
FROM CUSTOMER 
WHERE TerIritory_ ID = "Northwest"; 
典型 的 输出 内 容 和 格式 如 下 : 
Customer _ ID Customer Name Customer Address Territory_ID 
5 Value Furniture 394 Rainbow Dr., Seattle, WA 97954 Northwest 


9 Furniture Gallery 816 Peach Rd., Santa Clara, CA 96915 Northwest 


该 SQL 查询 的 解释 与 前 一 查询 相似 。 
3.8.3 显示 顾客 订单 状态 

以 上 的 查询 相对 简单 ， 每 个 例子 仅 涉及 一 张 表 中 的 数据 。 通 常 ， 在 一 个 查询 中 需要 用 到 多 
张 表 中 的 数据 。 尽 管 查询 很 简单 ， 仍 然 要 浏览 整个 数据 库 以 找 出 满足 查询 条 件 的 实体 和 属性 。 

为 简化 查询 的 编写 以 及 出 于 其 他 原因 ， 许 多 数据 库 管理 系统 支持 创建 有 限 的 、 满 足 特定 用 
户 信 息 需求 的 数据 库 视 图 。 对 于 与 用 户 订单 状态 相关 的 查询 ， 松 谷 家 具 公 司 应 用 如 图 3-23a 所 
示 的 用 户 视图 “顾客 订单 ”"。 这 个 用 户 视图 仅 允 许 用 户 看 到 数据 库 中 的 CUSTOMER 和 ORDER 








实体 ， 以 及 这 些 实体 在 图 中 所 显示 的 属性 。 正 如 第 5 章 中 所 介绍 的 ， 属 性 Customer_ID 将 被 加 入 
到 ORDER 实体 中 〈 如 图 3-23a)。 一 个 典型 的 订单 状态 查询 是 : 











Standard_Price 


b) 用 户 视图 2:， 产品 订单 
图 3-23 松 谷 家 具 公 司 的 两 个 用 户 视 图 

公司 从 “Value 家 具 公 司 ” 收 到 了 多 少 个 订单 ? 

编写 这 个 查询 的 SQL 代码 可 以 使 用 许多 办 法 。 本 章 选 择 的 方法 是 在 一 个 查询 中 组 合 另 一 个 
查询 《 即 子 查询 )。 这 个 查询 分 两 步 执行 。 首 先 ， 子 查询 (或 称 为 内 部 查询 ) 遍历 CUSTOMER 
实体 以 确定 名 称 为 “Value Furmiture” 的 顾客 的 Customer ID (从 前 一 个 查询 可 知 ， 该 公司 的 ID 
为 5) ; 然后 ， 查 询 (或 称 为 外 部 查询 ) 遍历 ORDER 实体 并 计算 出 所 有 该 顾客 的 订单 总 数 。 

通过 “顾客 订单 ”用 户 视图 进行 该 查询 的 SQL 代码 如 下 : 

SELECT COUNT (Order_ID) 

FROM ORDER 


Product JD 
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WHERE Customer ID= 
(SELECT Customer ID 
FROM CUSTOMER 
WHERE Customer Name="Value Furniture"); 


该 查询 的 典型 输出 为 : 
COUNT (Order_ID) 
4 


3.8.4 显示 产品 销售 

销售 员 、 区 域 经 埋 、 产 品 经 理 、 生 产 经 理 以 及 相关 人 员 都 需要 知道 产品 的 销售 状况 。 获 知 
哪 种 产品 在 某 个 月 的 销售 比较 强劲 就 是 这 一 类 问题 。 该 查询 的 一 般 形式 如 下 : 

在 上 个 月 (2001 年 6 月 )， 哪 种 产品 的 销售 总 额 突破 25 000 美 元 ? 

这 个 查询 可 以 使 用 图 3-23b 所 示 的 用 户 视 图 “orders for products” 编 写 。 该 查询 涉及 的 数据 
源 如 下 : 

。ORDER 实 体 中 的 Order_Date 属 性 (以 找 出 在 期 望月 份 中 的 订单 )。 

。 在 期 望月 份 中 ， 与 实体 ORDER 相 联系 的 关联 实体 ORDER LINE 中 每 一 个 订单 里 每 一 种 产 

品 的 数量 。 

。 与 实体 ORDER LINE 相 联系 的 实体 PRODUCT 中 产品 的 Standard_Price。 

对 于 在 2001 年 6 月 订购 的 每 项 产品 ， 查 询 通过 将 Quantity 与 Standard_Price 相 乘 得 出 销售 额 。 
通过 累计 所 有 订单 中 的 某 种 产品 的 销售 额 ， 就 可 以 得 到 这 种 产品 的 总 销售 额 。 结 果 中 仅 显 示 总 
销售 额 超过 25 000 美 元 的 产品 数据 。 

这 个 查询 的 SQL 代码 已 经 超出 本 章 的 介绍 范围 ， 其 编写 方法 需要 用 到 在 第 5 章 中 介绍 的 技 
术 。 在 第 5 章 中 ， 将 进一步 讨论 这 个 查询 的 SQL 代码 。 本 章 使 用 这 个 查询 的 目的 只 是 为 了 说 明 
图 3-22 所 示 的 数据 库 具有 从 细节 数据 中 查找 管理 信息 的 能 力 。 在 许多 现代 的 组 织 中 ， 用 户 使 用 
Web 浏 览 器 来 获取 上 述 信息 。 与 Web 页 有 关 的 程序 代码 调用 相应 的 SQL 命 令 来 获取 所 需 的 信息 。 


本 章 小 结 


本 章 详 述 了 组 织 中 数据 建 模 的 基础 。 在 一 个 组 织 中 ， 可 以 从 制度 、 过 程 、 事 件 、 职 能 和 其 
他 业务 对 象 中 总 结 出 业务 规则 ， 然 后 由 业务 规则 定义 管理 组 织 的 约束 ， 从 而 说 明 如 何 处 理 和 存 
储 数据 。 对 于 信息 系统 ， 特 别 是 数据 库 应 用 系统 ， 业 务 规 则 是 否 具 有 强大 的 功能 来 描述 系统 中 
的 需求 ， 人 们 尚 有 争议 。 业 务 规 则 的 能 力 取决 于 以 下 条 件 是 否 满足 : 业务 规则 应 该 是 业务 的 核 
心 概念 ; 应 能 够 以 最 终 用户 熟 悉 的 术语 表达 ; 应 具有 高 度 的 可 维护 性 以 及 能 够 用 自动 的 方法 
(大 部 分 是 通过 数据 库 ) 执行 。 一 个 好 的 业务 规则 有 以 下 特征 : 可 声明 性 、 精 确 性 、 原 子 性 、 
一 致 性 、 可 区 分 性 和 面向 业务 性 。 

基本 的 业务 规则 是 数据 名 称 和 数据 定义 。 本 章 讲 述 了 在 业务 中 清晰 地 命名 和 定义 数据 对 象 
的 方法 。 在 概念 数据 建 模 中 ， 必 须 对 实体 类 型 、 属 性 和 联系 进行 命名 和 定义 。 其 他 的 业务 规则 
可 能 在 这 些 数据 对 象 之 上 定义 约束 。 这 些 约束 可 以 从 数据 模型 和 其 他 相关 的 文档 中 获得 。 

现在 最 常用 的 数据 建 模 符号 是 实体 -联系 数据 模型 。E-R 模 型 表示 组 织 中 数据 的 细节 和 届 
得 关系 。E-R 模 型 通常 由 E-R 图 表示 ，BE-R 图 是 E-R 模 型 的 图 形 化 表示 。1976 年 ，Chen 首 先 提出 
了 E-R 模 型 。 但 迄今 为 止 ，E-R 模 型 还 没有 一 套 标准 的 符号 体系 。 

E-R 模 型 中 的 基本 结构 为 实体 类 型 、 联 系 和 有 关 的 属性 。 实 体 是 用 户 环境 中 诸如 人 、 地 方 、 
对 象 、 事 件 和 概念 等 ， 实 体 以 组 织 中 存储 的 数据 形式 表示 。 实 体 类 型 是 具有 相同 性 质 的 实体 集 





合 ， 而 实体 实例 是 实体 类 型 的 实例 化 。 强 实体 类 型 拥有 属于 自身 的 标识 符 ， 并 且 它 的 存在 不 依 
赖 于 其 他 实体 。 弱 实体 类 型 的 存在 依赖 于 一 个 强 实体 类 型 。 弱 实体 没有 属于 自身 的 标识 符 ， 通 
各 情况 下 只 有 一 个 部 分 标识 符 。 一 般 通 过 属 主 实体 类 型 的 标识 联系 来 标识 弱 实 体 类 型 。 

属性 组 织 感 兴趣 的 实体 或 联系 的 性 质 和 特征 。 属 性 有 许多 种 类 。 简 单 属性 不 能 分 解 。 复 合 
属性 可 以 分 解 为 更 小 的 组 成 部 分 。 例 如 ，Person_Name 可 以 分 解 为 First_Name、Middle_Name 
和 Last_Name。 多 值 属性 在 实体 的 一 个 实例 中 有 多 个 值 。 例 如 ， 一 个 人 的 College_Degree 属 性 
中 可 能 有 多 个 值 。 导 出 属性 的 值 可 由 其 他 属性 值 计 算得 到 。 例 如 ，Average_Salary (平均 工资 ) 
可 以 由 全 体 员 工 的 Salary 计 算得 到 。 

标识 符 是 可 以 惟一 确定 一 个 实体 类 型 的 实例 的 属性 。 必 须 谨 慎 选 择 标 识 符 以 确保 其 稳定 性 
和 使 用 方便 。 标 识 符 可 以 是 简单 属性 ， 也 可 以 是 复合 属性 。 

联系 类 型 是 两 个 或 多 个 实体 类 型 之 间 具 有 明确 意义 的 关联 。 联 系 实例 是 两 个 或 多 个 实体 实 
例 之 间 具 有 明确 意义 的 关联 。 联 系 的 度 指 参与 联系 的 实体 类 型 的 个 数 。 最 常见 的 联系 类 型 有 一 
元 联系 (度数 为 1)、 二 元 联系 (度数 为 2) 和 三 元 联系 (度数 为 3)。 

在 开发 E-R 图 时 ， 有 时 会 遇 到 多 对 多 (或 一 对 一 ) 联系 的 情况 。 在 这 种 情况 下 ， 联 系 可 能 
会 有 属于 自身 的 一 个 或 多 个 属性 ， 而 不 是 与 某 个 参与 实体 类 型 相关 的 属性 。 这 提示 开发 者 可 以 
将 联系 转化 为 一 个 关联 实体 。 这 种 实体 在 多 个 实体 实例 之 间 起 关联 作用 ， 并 且 拥 有 属于 自身 的 
属性 。 关 联 实体 类 型 的 标识 符 可 能 是 一 个 属于 该 实体 类 型 的 简单 属性 ， 也 可 能 是 在 逻辑 设计 过 
程 中 分 配 的 一 个 复合 属性 。 

基数 约束 声明 实体 B 的 实例 可 能 (或 必须 ) 与 实体 A 的 每 个 实例 相关 联 的 个 数 。 基 数 约束 
通常 指定 实例 个 数 的 最 大 值 和 最 小 值 。 该 约束 可 能 是 强制 为 一 、 强 制 为 多 、 可 选 为 一 、 可 选 为 
多 或 者 一 个 特定 的 数值 。 最 小 基数 约束 也 可 称 为 参与 约束 。 最 小 基数 为 0 指定 可 选 参与 约束 ， 
最 小 基数 为 1 指定 强制 参与 约束 。 





本 章 复习 
关键 术语 
关联 实体 复合 属性 实体 实例 
属性 复合 标识 名 实例 -联系 图 (E-R 图 ) 
二 元 联系 度 业务 规则 
导出 属性 实体 -联系 模型 (E-R 模 型 ) 基数 约束 
实体 实体 类 型 最 小 基数 
术语 事实 多 值 属 性 
三 元 联系 标识 名 联系 实例 
时 间 惟 标识 属 主 联系 类 型 
一 元 联系 标识 联系 简单 属性 
弱 实 体 类 型 最 大 基数 强 实体 类 型 
复习 问题 
1. 定义 以 下 术语 : 
a. 实体 类 型 b. 实体 -联系 模型 
c. 实体 实例 d. 属性 
e. 联系 类 型 f. 标识 符 


g. 多 值 属性 h. 关联 实体 
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i. 基数 约束 j. 弱 实 体 
k. 标识 联系 1 导出 属性 
m. 多 值 属 性 n. 业务 规则 
2. 将 下 列 术语 和 定义 匹配 起 来 。 
复合 属性 a. 惟一 确定 实体 实例 
_ 关联 实体 b. 一 个 实体 的 实例 之 间 的 联系 
一 元 联系 c. 声明 实 例 的 最 大 和 最 小 个 数 
~ _ 碳 实 体 d. 以 实体 类 型 的 形式 建 模 的 联系 
属性 e. 表示 实体 类 型 之 间 的 关联 
实体 f. 相同 实体 的 集合 
~ 联系 类 型 g. 参与 联系 的 实体 类 型 个 数 
_ 基数 约束 h. 实体 的 性 质 
_ 度 i. 可 以 分 解 为 更 小 的 组 成 部 分 
标识 季 j. 其 存在 依赖 于 其 他 实体 类 型 
~ 实体 类 型 k. 度数 为 3 的 联系 
了 工 元 1. 多 对 多 的 一 元 联系 
一 材料 单 m. 人、 地 方 、 对 象 、 概 念 和 事件 等 
3. 解释 下 列 术 语 的 区 别 与 联系 。 
a. 存储 属性 ; 导出 属性 b. 实体 类 型 ;实体 实例 
c. 简单 属性 ; 复合 属性 d. 实体 类 型 ; 联系 类 型 
c. 强 实体 类 型 ， 弱 实体 类 型 f. 度 ; 基数 
4. 为 什么 许多 系统 设计 人 员 认 为 数据 建 模 是 系统 开发 过 程 中 最 重要 的 一 个 环节 。 给 出 至 少 


三 条 理由 。 
5. 解释 为 什么 业务 规则 方法 被 称 为 系统 需求 的 新 的 范 型 。 给 出 至 少 四 条 理由 。 
6. 说 明 在 组 织 中 何 处 可 以 发 现 业务 规则 。 
7. 阐述 数据 模型 中 数据 对 象 命名 的 6 条 一 般 原则 。 
8. 阐述 在 实体 中 选择 标识 符 的 4 条 标准 。 
9. 说 明 在 哪 三 种 情况 下 ， 设 计 人 员 会 将 联系 建 模 为 关联 实体 类 型 。 
10. 列 出 4 种 基数 约束 ， 并 分 别 给 出 一 个 例子 。 
11. 给 出 一 个 本 章 未 提 及 的 弱 实体 类 型 的 例子 ， 指 出 标识 联系 存在 的 必要 性 。 
12. 解释 联系 的 度 。 列 由 本 章 所 述 的 三 种 类 型 的 联系 的 度 ， 并 分 别 给 出 一 个 例子 ， 
13. 给 出 本 章 未 提 及 的 下 列 概念 的 例子 : 


a. 导出 属性 b. 多 值 属 性 
c. 复合 属性 

14. 给 出 本 章 未 提 及 的 下 列 概念 的 例子 : 
a. 三 元 联系 b. 一 元 联系 


15. 给 出 以 生效 日 期 作为 实体 属性 的 例子 。 

16. 阐述 在 什么 情况 下 ， 应 将 某 个 属性 从 实体 类 型 中 取出 并 置 于 一 个 链接 的 实体 类 型 中 。 
问题 和 练习 

1. 比较 业务 规则 中 “术语 ”和 “事实 ”这 两 个 概念 。 给 出 一 个 业务 规则 的 例子 并 指出 其 中 
的 术语 和 事实 。 





2. 在 3.6 节 中 详细 解释 了 图 3-22。 对 于 解释 中 的 每 一 条 ， 根 据 其 内 容 给 出 图 3-22 的 子 集 。 

3. 对 于 下 列 每 一 种 情况 ， 绘 制 相 应 的 E-R 图 。 如 果 需 要 添加 其 他 属性 ， 应 就 这 些 属性 进行 
说 明 。 

a. 某 公司 有 多 名 员工 。EMPLOYEE 的 属性 包括 Employee_ID (标识 符 )、Name、Address 
和 Birthdate。 该 公司 有 多 个 项 目 。PROJECT 的 属性 包括 Project_ID (标识 符 )、Project_Name 和 
Start_Date。 每 个 员工 可 以 分 配 到 一 个 或 多 个 项 目 中 ， 也 可 以 不 被 分 配 到 任 一 项 目 中 。- 一 个 项 
目 中 至 少 有 一 名 员工 ， 也 可 以 有 多 名 员工 。 某 个 员工 的 工资 水 平 根据 不 同 项 目 而 变化 ， 公 司 希 
望 记录 每 个 员工 被 分 配 到 某 个 项 目 时 对 应 的 工资 水 平 (Billing_Rate )。 上 述 描 述 中 出 现 的 属性 
名 是 否 符合 书 中 所 讲 的 原则 ? 如 果 不 是 ， 给 出 更 好 的 属性 名 。 

b. 某 大 学 开设 许多 课程 。COURSE 的 属性 包括 Course_Number (标识 符 )、Course_Name 和 
Units。 每 门 课程 可 能 要 求 先 学 完 一 至 多 门 预备 课程 ， 也 可 能 不 要 求学 习 任 何 预备 课程 。 同 样 ， 
某 门 课程 可 能 是 多 门 课程 的 预备 课程 , 也 可 能 不 是 任何 课程 的 预备 课程 。 给 出 COURSE 的 定义 。 
并 说 明 该 定义 为 什么 是 一 个 良好 的 定义 。 

c. 一 个 实验 富有 多 名 化 学 家 ， 分 别 从 事 一 个 或 多 个 项 目 。 化 学 家 在 每 个 项 目 中 可 能 用 到 某 
些 种 类 的 仪器 。CHEMIST 的 属性 包括 Employee_ID (标识 符 )、Name 和 Phone_No (电话 号 码 )。 
PROJECT 的 属性 包括 Project_ID (标识 符 ) 和 Start_Date (开始 日 期 )。EQUIPMENT (仪器 ) 
的 属性 包括 Serial_No (编号 ) 和 Cost。 组 织 希望 记录 Assign_Date， 即 将 某 台 仪器 分 配给 特定 
项 目 中 某 个 特定 化 学 家 使 用 的 日 期 。 一 个 化 学 家 必须 至 少 分 配 至 一 个 项 目 中 ， 并 至 少 分 配 一 台 
仪器 。 某 台 仪 器 可 能 闲置 ， 某 个 项 目 也 可 能 既 没 有 化 学 家 工作 也 没有 分 配 仪器 。 给 出 上 述 情况 
下 所 有 联系 的 定义 。 

d. 一 门 大 学 的 课程 可 能 被 分 为 几 个 班级 ， 也 可 能 不 包含 任何 班级 。COURSE 的 属性 包括 
Course_ID、Course_Name 和 Units。SECTION 的 属性 包括 Section_Number 和 Semester_ID。 
Semester_ID 由 两 部 分 组 成 : Semester 和 Year。Section_Number 是 一 个 整数 (如 “1” 或 “2”)， 
用 来 区 别 同一 课程 中 的 不 同班 级 ,但 并 不 能 独立 标识 一 个 班级 。 岂 述 如 何 为 SECTION 建 模 ， 
并 说 明 为 什么 采取 这 种 建 模 方式 而 不 采取 其 他 方式 的 理由 。 

ce. 某 医院 中 有 许多 医生 。PHYSICIAN 的 属性 包括 Physician_ID (标识 符 ) 和 Specialty。 病 
人 由 医院 中 的 医生 治疗 。PATIENT 的 属性 包括 Patient_ID (标识 符 ) 和 Patient_Name。 任 何 病 
人 都 必须 由 且 仅 由 一 名 医生 对 其 进行 诊断 。 医 生 可 以 诊断 多 名 病人 。 一 旦 诊断 结束 ， 一 名 病人 
必须 由 至 少 一 名 医生 对 其 进行 治疗 。 一 名 医生 可 能 会 治疗 多 名 病人 ， 也 可 能 不 治疗 任何 一 名 病 
人 。 医 院 需 要 记录 任何 时 候 某 个 医生 对 某 个 病人 进行 治疗 的 细节 (Treatment_Detail ) 。 
Treatment_Detail 由 Date、Time 和 Results 组 成 。 请 问 : 在 医生 和 病人 之 间 是 否 存在 多 种 联系 ? 
请 说 明 原 因 。 

4. 图 3-24 所 示 为 每 学 期 末 发 给 学 生 的 成 绩 单 。 试 设计 一 个 E-R 图 以 反映 成 绩 单 中 的 所 有 数 
据 。 假 定 每 门 课 仅 由 一 名 教师 讲授 。 

5. 实体 类 型 STUDENT 有 下 列 属 性 : Student_Name、Address、 Phone、Age、Activity 和 
No_of_Years。Activity 表 示 某 项 学 校 组 织 的 活动 ， No_of_Years 表 示 学 生 参 加 恋 活 动 的 年 数 。 一 
个 学 生 可 能 参加 不 止 一 项 活动 。 绘 制 E-R 图 表示 这 种 情况 。 

6. 为 一 个 房地产 公司 开发 一 个 与 销售 有 关 的 E-R 图 ， 并 给 出 图 中 每 个 实体 类 型 、 属 性 和 联 
系 的 定义 。 该 公司 情况 的 描述 如 下 : 

* 公司 在 不 同 的 州 有 许多 销售 部 。 销 售 部 的 属性 包括 Office_Number (标识 符 ) 和 Location。 

“每 个 销售 部 中 有 一 名 或 多 名 员工 。 员 工 的 属性 包括 Employee_ID (标识 符 ) 和 


条 3 偶 组织 中 的 数据 建 模 109 








Employee_Name。 每 个 员工 只 能 分 配 到 一 个 销售 部 工作 。 
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* 每 个 销售 部 都 有 一 名 经 理 。 一 个 经 理 只 能 管理 他 所 在 的 销售 部 。 

* 公司 要 列举 出 销售 的 许多 房产 。 这 些 房产 的 属性 包括 Property_ID (标识 符 ) 和 Location。 
Location 由 Address、City、State 和 Zip_Code 组 成 。 

* 一 个 销售 部 可 能 列举 出 多 个 销售 出 的 房产 ,但 也 可 能 无 法 记 举 出 任何 一 套房 产 。 

“每 套房 产 均 有 一 个 至 多 个 拥有 者 。 拥 有 者 的 属性 包括 Owner_ID (标识 符 ) 和 Owner_Name。 
一 个 拥有 者 可 以 拥有 一 僚 至 多 套房 产 。 房 产 和 拥有 者 间 的 联系 有 一 个 属性 Percent_Owned。 

7. 在 下 列 图 中 加 入 合理 的 最 大 和 最 小 基数 符号 。 


a. 图 3-5 d. 图 3-12 (所 有 部 分 ) 
b. 图 3-10a e. 图 3-13¢c 
c. 图 3-11b f. 图 3-14 


8. 假设 在 学 完 数据 库 管理 课程 以 后 ， 有 人 请 你 为 一 个 交响 乐团 设计 一 个 初步 的 E-R 图 。 通 
过 研究 ， 你 发 现 如 下 实体 类 型 : 

“CONCERT SEASON 在 该 演出 季 将 举办 一 系列 音乐 会 。 其 标识 符 为 Opening_Date， 其 
中 包括 Month、Day 和 Year。 

“CONCERT ”要 演奏 一 个 至 多 个 曲目 的 一 次 演出 。 标 识 符 为 Concert_Number， 另 一 个 重 
要 的 属性 是 Concert_Date (演出 日 期 )， 这 个 属性 由 Month、Day、Year 和 Time 组 成 。 每 台 
编排 好 的 音乐 会 可 以 在 不 同日 期 演奏 多 个 场次 。 

“COMPOSITION 在 每 场 音 乐 会 上 演奏 的 曲目 。 标 识 符 为 Compositon_ID ,该 属性 由 
Composer_Name (作者 ) 和 Composition_Name (曲目 ) 组 成 。 另 一 个 重要 的 属性 是 
Movement_ID (乐章 标识 ) ， 该 属性 包括 两 个 部 分 : Movement_Number (乐章 号 ) 和 
Movement_Name (乐章 名 )。 许 多 曲目 (但 不 是 所 有 曲目 ) 都 有 多 个 乐章 。 

*CONDUCTOR 指挥 音乐 会 的 人 。 标 识 符 为 Conductor ID。 另 一 个 属性 是 
Conductor_Name。 

“SOLOIST 在 某 台 音乐 会 上 演奏 某 个 曲目 的 独奏 演员 。 其 标识 符 为 Soloist_ ID 。 另 一 个 属 
性 为 Soloist_ Name。 

通过 进一步 讨论 ， 你 还 发 现 以 下 规则 : 

“在 一 个 演出 季 安 排 一 台 至 多 台 音 乐 会 。 某 台 音 乐 会 只 安排 在 一 个 演出 季 举 行 。 

* 一 台 音 乐 会 包含 一 个 或 多 个 节目 的 表演 。 一 个 节目 可 以 在 一 个 或 多 个 音乐 会 上 表演 ， 或 








者 可 能 不 表演 。 

“每 台 音 乐 会 都 有 一 个 指挥 。 某 个 指挥 可 以 指挥 多 台 音 乐 会 ， 也 可 能 不 指挥 任何 … 台 音乐 会 。 

* 每 个 出 日 可 能 需要 -名 至 多 名 独奏 演员 ， 也 可 能 不 需要 独奏 演员 。 独 奏 演 由 可 以 参与 一 

台 音 乐 会 上 一 个 至 多 个 曲目 的 演出 ， 也 可 以 不 参加 任 一 曲目 的 演出 。 交 响 乐 团 希 望 记录 

独奏 演员 参加 的 最 后 一 个 场次 演出 的 日 期 (Date_Last_Performed ) 。 

绘制 E-R 图 以 表示 上 述 内 容 。 根 据 上 述 内 容 确定 业务 规则 ， 并 解释 如 何 使 用 E-R 图 为 该 业 
务 规 则 建 模 。 

9. 研究 一 个 常见 的 用 户 视图 ， 如 信用 卡 账目、 电话 账单 以 及 其 他 一 些 常 见 的 文档 。 党 试 为 
该 文档 设计 E-R 图 。 

10. 为 你 熟悉 的 组 织 设计 E-R 图 ， 如 男 童 了 军 、 女 童子 军 以 及 运动 队 等 。 

11. 针对 下 列 情况 设计 E-R 图 ( 见 Batra、Hoffer 和 Bostrom 的 著作 ，1988)。 则 时 ， 选 择 一 组 
单词 作为 标识 符 和 类 ， 以 便 形 成 属性 名 ， 并 解释 选择 这 些 单词 的 原因 。 

Projects Jnc， 是 一 家 拥有 近 500 名 员工 的 工程 公司 。 现 需 设计 一 个 数据 库 以 记录 有 关 全 体 员 
工 、 他 们 的 技能 、 所 从 事 的 项 目 和 所 在 部 门 的 情况 。 公 司 给 每 个 员工 分 配 一 个 工 号 ， 同 时 还 需 
存储 员工 的 姓名 和 生日 。 如 果 公 司 内 两 个 员工 有 婚姻 关系 ， 则 记录 其 结婚 日 期 和 配偶 。 但 如 果 
员工 的 配偶 不 是 本 公司 员工 ， 则 不 需要 记录 其 婚姻 状况 。 每 个 员工 有 一 个 职务 (如 工程 师 、 秘 
书 等 )。 在 给 定时 间 内 ， 某 个 员工 只 能 有 一 项 职务 ， 并 且 在 数据 库 中 只 需要 存储 其 当前 的 职务 。 

公司 内 有 11 个 部 门 ， 部 门 的 名 称 是 惟一 的 。 每 个 员工 仅 隶 属于 一 个 部 门 。 每 个 部 门 有 一 个 
电话 号 码 。 

每 个 部 门 可 以 从 多 个 供 货 商 处 购 得 多 种 设备 。 一 个 供 货 商 可 以 向 多 个 部 门 提供 设备 。 需 要 
记录 每 个 供 货 商 的 名 称 和 地 址 以 及 部 门 和 供 货 商 最 后 -次 会 谈 的 日 期 。 

一 个 项 目 中 可 以 有 多 名 员工 在 工作 。 一 名 员工 可 以 在 多 个 项 目 中 工作 〈 例 如，Southwest 
Refinery、California Petrochemicals 等 等 ), 但 是 一 个 员工 在 一 个 给 定 的 城市 中 只 能 从 事 一 个 项 目 。 
对 于 每 个 城市 ， 需 要 存储 其 所 在 的 州 和 人 口 。 一 名 员工 可 以 有 多 项 技能 ， 如 准备 材料 需求 、 检 
查 图 纸 等 ， 但 在 一 个 给 定 的 项 目 中 可 以 只 用 其 中 的 几 项 技能 。 如 员工 MURPHY 在 Southwest 
Refinery 项 目 中 做 准备 材料 的 工作 ， 而 在 California Petrochemicals 项 目 中 做 准备 材料 和 检查 图 纸 
的 工作 。 员 工 利用 自己 的 各 项 技能 参与 至 少 一 个 项 目 。 每 项 技能 有 一 个 编号 ， 在 数据 库 中 需 存 
储 关于 每 一 项 技能 的 简单 描述 。 不 同 的 项 目 有 各 自 的 项 目 号 ， 并 应 存储 大 概 的 项 目 成 本 。 

12. 针对 下 列 情况 设计 E-R 图 。 如 果 必 须 作 出 一 些 假设 ， 才能 使 图 形 的 含义 完整 ， 则 给 出 并 
说 明 这 些 假设 。Stillwater 古 董 店 收购 并 销售 各 类 古董 ， 如 家 具 、 珠 宝 、 瓷器 和 衣物 等 。 每 一 件 
古董 都 有 一 个 编号 ， 其 他 特征 还 包括 描述 、 开 价 、 条 件 和 自由 评论 等 信息 。Stillwater 从 客户 手 
里 购 入 古董 ， 并 卖 给 其 他 客户 。 一 些 客户 只 卖 出 古董 ， 而 另外 一 些 客户 只 买 人 十 董 ， 但 其 他 的 
客户 可 能 既 从 这 里 买 人 ， 也 向 Stillwater 卖 出 他 们 手 里 的 古董 。 客户 通过 客户 号 进行 标识 ， 其 他 
属性 还 包括 客户 名 和 客户 地 址 。 当 Stillwater 卖 出 一 件 十 董 后 ， 需要 记录 佣金 、 售 价 、 税 金 〈 税 
金 为 0 表示 免税 ) 和 售 出 日 期 。 当 Stillwater 买 人 一 件 十 董 后 ， 需要 记录 买 人 价格 、 买 人 日 期 和 
当时 的 条 件 。 

13, 针对 下 列 情况 设计 E-R 图 。 如 果 必 须 作出 一 些 假设 ， 才能 使 图 形 的 含义 完整 ， 则 给 出 并 
说 明 这 些 假设 。H.I.Topi School of Business 从 事 国际 培训 和 教育 业务 ， 其 业务 范围 遍及 欧洲 的 10 
个 地 区 。1965 年 ， 学 校 首 期 毕业 9000 名 学 生 。 学 校 保存 毕业 生 的 以 下 档案 : 每 个 毕业 生 的 学 号 、 
在 校 时 的 姓名 、 出 生 国 、 现 在 的 国籍 、 现在 的 名 字 、 现 在 的 地 址 以 及 学 生 所 完成 的 每 个 专业 
(每 个 学 生 可 以 有 1 至 2 个 专业 )。 为 了 加 强 其 校友 之 间 的 联系 ， 学 校 在 全 世界 举办 一 系列 活动 。 
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活动 的 属性 有 主题 、 日 期 、 地 点 和 类 型 (如 招待 会 、 座 谈 会 和 讨论 会 等 )。 学 校 应 该 保存 毕业 生 
参加 这 些 活 动 的 记录 。 当 某 个 毕业 生 参 加 一 次 活动 ， 校 方 在 学 生 档 案 中 记录 关于 该 生 在 该 活动 
中 的 一 条 说 明 。 学 校 也 同时 保存 毕业 生 的 联系 方式 ， 如 邮政 地 址 、 电 子 邮 件 、 电 话 号 码 和 传真 
多 码 等 。 当 举办 活动 时 ， 学 校 通过 上 述 方式 与 毕业 生 联 系 。 当 学 校 需要 与 一 个 毕业 生 联 系 时 ， 
就 会 打印 出 一 份 报告 。 报 告 上 会 列 出 近 两 年 历次 联系 和 活动 中 记录 的 学 生 的 最 新 信息 。 

14. 假定 在 松 谷 家 具 公 司 的 每 种 产品 (其 属性 有 产品 号 、 产 品 描述 和 成 本 ) 至 少 包括 三 种 
组 件 (其 属性 有 组 件 号 、 组 件 描述 和 度量 单位 )， 每 种 组 件 可 用 于 制造 一 至 多 种 产品 。 另 外 ， 
假定 组 件 可 用 于 制造 其 他 的 组 件 ， 而 且 假 设 原 材料 也 是 一 种 组 件 。 在 这 两 种 情况 下 ， 需 要 记录 
组 装 时 用 掉 多 少 组 件 。 针 对 这 些 情况 设计 E-R 图 ， 并 在 图 上 标 出 最 大 和 最 小 基数 。 

15. 股票 经 纪 人 代 客 户 卖 出 股票 ， 股 票 价格 不 断 变化 。 根 据 这 些 情况 设计 E-R 图 ， 需 要 考虑 
股票 价格 的 变化 。 

16. 在 每 个 学 期 ， 学 校 给 每 个 学 生 指定 一 名 导师 。 导 师 指 导 学 生 如 何 取得 学 位 ， 并 帮助 学 
生 选 择 课 程 。 学 生 应 在 辅导 员 的 帮助 下 选择 课程 ， 但 如 果 指 定 给 该 学 生 的 导师 不 在 ， 学 生 可 以 
在 其 他 导师 的 帮助 下 选择 课程 。 学 校 要 记录 以 下 信息 : 学 生 ， 指 定 给 学 后 的 导师 ， 耕 助 学 生 选 
择 课 程 的 导师 的 姓名 。 在 E-R 图 中 描述 上 述 关于 学 生 和 导师 的 信息 。 

17. 在 图 3-22 中 ， 考 虑 每 个 多 对 多 (M:N) 联系 。 对 于 每 个 多 对 多 联系 ， 应 该 用 一 个 关联 
实体 表示 。 试 解释 之 。 重 画 E-R 图 中 将 多 对 多 联系 转化 为 关联 实体 的 部 分 。 

应 用 练习 

1. 咨询 一 个 数据 库 分 析 人 员 或 系统 设计 人 员 ， 了 解 他 们 在 数据 模型 中 如 何 命名 数据 对 象 。 
他 所 在 的 组 织 是 否 有 自己 的 命名 约定 。 如 果 有 ， 描述 该 模式 ; 如 果 没 有 ， 询 问 对 方 在 没有 命名 
约定 的 前 所 下 ， 是 否 曾经 出 现 问题 。 

2. 访问 两 个 本 地 的 小 型 企业 。 一 个 属于 服务 业 ， 如 干洗 店 、 汽 车 修理 店 、 宠 物 医院 或 书店 
等 ; 另 一 个 属于 制造 业 ,生产 实际 的 产品 。 与 其 员工 进行 交流 , 找 出 在 这 些 组 织 中 常见 的 实体 、 
属性 和 联系 。 使 用 上 述 信息 绘制 E-R 图 。 服 务 业 和 制造 业 企业 的 E-R 图 有 何 异 同 ? 实体 -联系 建 
模 技术 是 否 能 够 较 好 地 处 理 这 两 种 情况 ?解释 原因 。 

3. 咨询 数据 库 或 系统 分 析 人 员 。 根 据 他 所 在 的 公司 的 情况 ， 给 出 一 元 、 二 元 和 三 元 关系 的 
例子 。 说 明 其 中 哪些 例子 比较 常见 ， 并 解释 之 。 

4. 请 一 个 本 地 企业 的 数据 库 或 系统 分 析 人 员 展 示 该 企业 某 个 基本 数据 库 的 E-R 图 。 如 果 有 
不 清楚 的 地 方 ， 你 可 以 向 他 提问 ， 以 便 你 能 够 透彻 理解 每 个 实体 ， 属 性 和 联系 的 含义 。 该 组 织 
所 使 用 的 E-R 符 号 是 否 与 书 中 所 述 的 相同 ?如 果 不 同 ， 描 述 该 企业 所 使 用 的 E-R 符 号 ， 并 给 出 每 
个 符号 的 含义 。 该 企业 的 E-R 图 中 是 否 出 现 关联 实体 ?如果 没 有 ， 给 出 其 关联 实体 的 建 模 方法 。 

5. 对 于 上 题 或 其 他 任 一 数据 库 所 对 应 的 E-R 图 ， 考 察 其 中 是 否 存在 时 间 葵 或 其 他 时 间 依 球 
数据 的 模型 。 说 明 对 于 用 户 来 说 ， 时 间 依 赖 数据 存在 的 必要 性 。 如 果 不 需要 描述 属性 值 的 历史 
记录 ，E-R 是 图 否 可 以 大 幅度 简化 。 
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项 目 案例 : 山 景 社区 医院 


项 目 描述 

假设 在 学 习 完 数据 库 管理 课程 之 后 ， 你 在 暑假 作为 一 名 实习 医生 受 雇 于 出 景 社区 医院 。 你 
的 第 一 项 任务 是 参加 一 个 三 人 开发 小 组 来 开发 医院 的 高 层 E-R 图 。 你 可 以 通过 和 医院 的 许多 管 
理 人 员 以 及 员工 进行 交流 ， 以 确定 医院 的 关键 实体 类 型 。 很 快 ， 小 组 确定 出 以 下 实体 类 型 

，Care center (诊疗 中 心 ) 一 一 医院 内 部 的 诊疗 中 心 ， 如 产科 和 急救 中 心 。 每 个 诊疗 中 心 

有 一 个 诊疗 中 心 ID (作为 标识 符 ) 和 一 个 诊疗 中 心 名 称 。 

* Patient (病人 ) 一 一 来 该 医院 看 病 的 住院 或 门诊 病人 。 每 个 病人 有 一 个 病人 号 (作为 标 

识 符 ) 和 其 名 字 。 

*Physician (医生 ) 一 一 为 病人 诊断 的 医生 和 负责 为 病人 进行 治疗 的 医生 。 每 个 医生 有 一 

个 医生 ID (作为 标识 符 ) 和 其 名 字 。 

。Bed (床位 ) 分 配给 一 个 住院 病人 的 一 张 病床 。 每 个 病床 有 一 个 床位 号 (作为 标识 

符 )， 一 个 房间 号 和 一 个 诊疗 中 心 ID。 

“Item (治疗 项 目 ) 一 一 用 于 治疗 病人 的 任何 内 科 或 外 科 项 目 。 每 个 治疗 项 目 有 项 目 号 

(标识 符 )、 描 述 和 单价 。 

*Employee ( 员工 ) 一 一 医院 雇佣 的 人 员 。 每 个 员工 有 一 个 名 字 和 员工 号 。 

"Treatment (治疗 方案 ) 一 一 医生 为 病人 执行 的 检查 或 治疗 过 程 。 每 个 治疗 方案 有 一 个 治 

疗 ID ， 它 包括 两 部 分 : 治疗 方案 号 和 治疗 方案 名 称 。 

完成 这 些 任 务 后 ， 该 小 组 下 一 步 需 记 录 有 关联 系 的 信息 。 

“ 医院 中 的 每 个 员工 被 分 配 在 一 个 或 多 个 诊疗 中 心 工 作 。 每 个 诊疗 中 心 至 少 有 一 名 员工 ， 

也 可 以 有 多 名 员工 。 医 院 记录 每 个 员工 在 某 个 诊疗 中 心 每 周 的 工作 小 时 数 。 

* 每 个 诊疗 中 心 有 且 仅 有 一 名 护士 被 指定 负责 管理 该 诊疗 中 心 。 

* 因为 存在 门诊 病人 ， 所 以 病人 可 能 被 分 配 一 个 床位 ， 也 可 能 不 分 配 床位 。 床 位 可 能 被 分 

配给 病人 ， 也 可 能 空闲 。 

“ 病人 被 指定 由 且 仅 由 一 名 医生 负责 。 医 生 可 以 负责 多 个 病人 ， 也 可 能 不 负责 任何 病人 。 

“医生 可 能 对 任意 多 个 病人 执行 任意 多 项 治疗 ， 也 可 能 不 执行 任何 治疗 。 病 人 也 可 能 由 多 

个 医生 实施 治疗 方案 。 对 于 每 项 由 一 个 特定 的 医生 给 特定 病人 实施 的 治疗 ， 医 院 记 录 以 

下 信息 : 治疗 日 期 、 治 疗 时 间 和 治疗 效果 。 

“病人 可 以 选择 接受 任意 多 项 的 治疗 项 目 。 一 个 治疗 项 目 可 对 一 个 或 多 个 病人 实施 ， 也 可 

能 没有 病人 选择 接受 该 项 治疗 。 对 于 一 个 病人 所 接受 的 一 项 治疗 项 目 ， 医 院 记 录 以 下 信 

息 : 日 期 时间、 数量 和 总 费用 (可 由 多 个 治疗 项 目的 合计 得 出 )。 

项 目 问题 

1) 山 景 社区 医院 为 什么 选择 实体 -联系 模型 来 为 数据 需求 建 模 ? 还 有 其 他 哪些 方法 能 够 建 
立 医院 的 信息 需求 模型 ? 

2) 在 山 景 社区 医院 的 数据 需求 中 是 否 有 弱 实 体 类 型 ?如 果 有 ， 列 出 这 些 实体 名 。 

3) 上 面 列 出 的 第 3 条 联系 中 ， 说 明 “ 给 住院 病人 分 配 床位 ， 而 不 给 门诊 病人 分 配 床位 >。 对 
于 出 景 社区 医院 的 E-R 图 设计 ， 这 条 语句 有 什么 意义 ? 

4) 在 描述 山 景 社区 医院 数据 需求 的 模型 中 ， 该 医院 本 身 是 一 个 数据 类 型 吗 ? 

项 目 练习 

1) 认真 研究 有 关 项 目的 描述 。 为 了 更 好 地 理解 山 景 社区 医院 的 数据 需求 ， 你 还 能 想 出 其 他 
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需要 医院 有 关 人 员 给 予 答复 的 问题 吗 ? 

2) 为 山 景 社区 医院 开发 E-R 图 ， 并 说 明 你 在 开发 过 程 中 所 作 的 假设 。 

3) 在 项 目的 描述 文件 中 ， 给 出 一 个 名 为 Item 的 实体 类 型 。 根 据 项 目 练习 2 的 结果 ， 室 内 电 
视 是 一 个 病人 需 付费 的 项 目 ， 该 项 目 是 否 也 可 用 Item 实 体 类 型 表示 ? 

4) 假定 属性 床位 号 是 一 个 复合 属性 ， 该 属性 由 诊疗 中 心 标识 、 病 房 号 和 病房 中 的 床位 号 组 
成 。 设 计 中 的 某 些 部 分 将 因为 这 个 复合 属性 而 发 生变 化 ， 试 根据 这 个 因素 重新 回答 项 目 练习 2 
的 有 关 部 分 。 

5) 在 加 入 项 目 练习 4 的 条 件 后 ,项 目 练习 2 的 答案 发 生变 化 ， 山 景 社区 医院 的 E-R 图 也 随 之 
更 新 。 现 再 增加 一 个 新 的 假设 : 一 个 诊疗 中 心 有 多 个 病房 ， 每 个 病房 有 多 个 收费 项 目 ， 试 据 此 
假设 更 新 E-R 图 。 

6) 在 你 所 作出 的 项 目 练 习 2 的 回答 中 ， 是 否 允 许多 名 医生 同时 对 一 个 病人 进行 治疗 ”如 果 
不 是 ， 重 新 回答 该 问题 的 相关 部 分 以 满足 这 个 条 件 。 试 根据 这 个 条 件 作 出 你 认为 合理 的 任何 假 
设 。 

7) 在 你 所 作出 的 项 目 练 习 2 的 回答 中 ， 是 否 允 许 一 名 医生 多 次 对 一 个 病人 执行 同一 治疗 方 
案 ? 如 果 不 是 ， 重 新 回答 该 问题 的 相关 部 分 以 满足 这 个 条 件 。 试 根据 这 个 条 件 作出 你 认为 合理 
的 任何 假设 。 





第 4 章 增强 型 E-R 模 型 和 业务 规则 


4.1 学 习 目标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

。 简 明 地 定义 下 列 每 一 个 关键 术语 : 增强 型 实体 -联系 (EER) 模 型 、 子 类 型 、 超 类 型 、 属 性 
继承 、 概 化 、 特 化 、 完 全 特 化 规则 、 部 分 特 化 规则 、 不 相交 规则 、 交 登 规则 、 子 类 型 鉴 
别 符 、 子 类 型 / 超 类 型 层次 、 实 体 聚 答 、 结 构 断 言 、 动 作 断 言 和 导出 事实 。 

。 理解 在 数据 建 模 中 ， 什 么 时 候 使 用 子 类 型 / 超 类 型 联系 。 

“定义 子 类 型 / 超 类 型 联系 时 ， 使 用 概 化 和 特 化 技术 。 

“在 建 模子 类 型 / 超 类 型 联系 的 时 候 ， 说 明 完备 性 约束 和 不 相交 约束 。 

* 为 实际 业务 情形 开发 一 个 超 类 型 / 子 类 型 层次 。 

“开发 一 个 实体 育 簇 ， 以 简化 实体 -联系 图 的 表示 。 

* 命 名 不 同 种 类 的 业务 规则 。 

"使 用 图 形 模型 或 结构 化 的 语句 ， 定 义 简 单 的 操作 约束 。 


4.2 引言 


第 3 章 所 论述 的 基本 的 实体 -联系 模型 ， 是 在 20 世 纪 70 年 代 中 期 首次 提出 的 。 它 适合 于 建 
模 大 部 分 常见 的 业务 问题 ,并 得 到 广泛 使 用 。 但是， 自 那 时 起 ， 业 务 环境 已 经 发 生 很 大 的 变化 。 
业务 联系 更 加 复杂 ， 因 而 ， 业 务 数 据 也 更 加 复杂 。 例 如 ， 组 织 必须 准备 将 市 场 分 割 成 不 同 的 部 
分 ， 并 定制 相应 的 产品 ， 而 这 些 都 对 组 织 的 数据 库 提 出 了 更 高 的 要 求 。 

为 了 更 好 地 处 理 这 些 变 化 ， 研 究 人 员 一 直 在 增强 E-R 实 体 模型 ， 使 其 能 够 更 精确 地 表示 当 
今 业务 环境 中 遇 到 的 复杂 数据 。 增 强 型 实体 -联系 (EER ) 模型 用 来 标识 扩充 的 模型 ， 即 用 这 
些 新 的 建 模 概念 扩充 原来 的 E-R 模 型 所 得 到 的 模型 。 

在 EER 模 型 中 引入 的 最 重要 的 概念 是 超 类 型 / 子 类 型 联系 。 这 种 方法 允许 我 们 先 建 模 一 个 
一 般 的 实体 类 型 ( 称 为 超 类 型 ), 然后 ,将 其 细 分 为 几 个 特殊 的 实体 类 型 ( 称 为 子 类 型 )。 例 如 ， 
可 以 将 实体 类 型 CAR 建 模 为 超 类 型 ， 将 SEDAN、SPORTS CAR、COUPE 等 作为 它 的 子 类 型 。 
每 一 个 子 类 型 从 其 超 类 型 中 继承 所 有 的 属性 ， 并 可 能 加 入 自己 的 特有 属性 。 为 超 类 型 / 子 类 型 
联系 的 建 模 增加 新 的 符号 ， 大 大 提高 了 基本 E-R 模 型 的 灵活 性 。 

E-R， 尤 其 是 EER 图 ， 可 能 会 变 得 很 大 而 且 很 复杂 ， 要 用 多 页 (或 非常 小 的 字体 ) 来 显示 。 
一 些 商 用 数据 库 包括 了 数 百 个 实体 。 对 于 大 部 分 指定 数据 库 需 求 的 用 户 和 管理 人 员 来 说 ， 如 果 
要 理解 数据 库 中 他 们 最 感 兴趣 的 一 部 分 ， 没 有 必要 了 解 所 有 的 实体 、 联 系 和 属性 。 实 体 聚 簇 是 
将 实体 -联系 数据 模型 的 一 部 分 转变 成 同样 数据 的 更 为 宏观 层次 的 视图 的 一 种 方法 。 实 体 聚 化 
是 一 种 层次 分 解 技术 ， 它 能 够 使 实体 -联系 图 更 易 读 。 通 过 将 实体 和 联系 分 组 ， 你 能 够 对 E-R 
图 进行 布局 ， 以 便 集 中 关注 给 定 的 数据 建 模 任务 中 最 重要 的 模型 的 细节 。 

增强 型 E-R 图 用 于 捕获 重要 的 业务 规则 ， 如 超 类 型 / 子 类 型 联系 中 的 约束 。 但 是 ， 大 部 分 
组 织 使 用 大 量 的 业务 规则 指导 其 行为 。 其 中 的 很 多 业务 规则 不 能 用 基本 的 E-R 图 ， 甚 至 是 增强 
型 E-R 图 表示 。 目 前 有 望 取得 成 果 的 研究 集中 于 开发 新 的 表示 业务 规则 的 方法 ， 使 最 终 用 户 经 
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过 某 些 培训 就 能 够 定义 他 们 自己 的 系统 的 规则 。 然后， 这 些 规则 会 自动 变 成 数据 库 管理 系统 强 
制 执行 的 约束 ， 使 数据 库 保持 一 致 、 有 效 的 状态 。 相 对 于 以 前 的 系统 开发 方法 ， 该 业务 规则 方 
法 使 得 组 织 对 变化 的 业务 条 件 可 以 更 快 地 做 出 反映 。 


4.3 超 类 型 和 子 类 型 的 表示 


回忆 一 下 第 3 章 ， 实 体 类 型 是 共享 公共 的 性 质 或 特征 的 实体 的 集合 。 构 成 实体 类 型 的 实体 
实例 都 是 相似 的 ， 我 们 并 不 期 望 它们 都 是 相同 的 。 数 据 建 模 中 的 一 个 主要 挑战 是 识别 并 清楚 地 
表示 几乎 是 相同 的 实体 ， 这 里 所 说 的 相同 的 实体 就 是 共享 共同 性 质 的 实体 类 型 ， 但 同时 有 具有 组 
织 所 感 兴趣 的 一 个 或 多 个 不 同 的 性 质 。 

下 是 由 于 这 个 原因 ， 人 研究 人 员 扩 展 了 实体 ~ 联系 模型 ， 使 其 包含 超 类 型 / 子 类 型 联系 。 子 类 
型 (subtype) 是 对 组 织 有 意义 的 实体 类 型 中 实体 的 分 组 子 群 ( 非 空 子 集 一 一 译 者 注 )。 例 如 ， 
STUDENT 是 大 学 中 的 一 个 实体 类 型 ，STUDENT 的 两 个 子 类 型 是 GRADUATE STUDENT 和 
UNDERGRADUATE STUDENT。 在 这 个 例子 中 ， 我 们 将 STUDENT 称 为 超 类 型 。 超 类 型 
(supertype) 是 一 般 的 实体 类 型 ， 与 一 个 或 多 个 子 类 型 具有 联系 。 

迄今 为 止 ， 在 构造 实体 -联系 图 的 过 程 中 ， 我 们 --- 直 没有 提 到 超 类 型 和 子 类 型 。 例 如 ， 再 
仔细 考虑 松 谷 家 具 公 司 的 实体 -联系 模型 (参见 图 3-22)。 请 注意 ， 并 不 是 所 有 顾客 在 一 个 销售 
区 域内 完成 其 业务 。 为 什么 会 这 样 呢 ? 一 个 可 能 的 原因 是 有 两 种 类 型 的 顾客 : 全 国 性 顾客 和 普 
通 磊 客 ， 只 有 普通 顾客 在 一 个 销售 区 域内 完成 交易 。 因 此 ， 在 图 3-22 中 ，Does-business-in 联 系 
上 的 与 CUSTOMER 相 邻 的 可 选 基数 的 理由 不 清楚 。 明 确 地 画 出 顾客 实体 子 类 型 及 几 个 实体 子 
类 型 有 助 于 使 E-R 图 更 有 意义 。 在 本 章 的 后 面 ， 我 们 将 给 出 一 个 修订 后 的 松 谷 家 具 公 司 的 E-R 
图 ,该 图 给 出 几 个 使 图 3-22 中 含糊 的 地 方 更 为 清楚 的 EER 符 号 。 

4.3.1 基本 概念 和 表示 方法 

图 4-1 给 出 了 用 于 表示 超 类 型 / 子 类 型 联系 的 基本 符号 。 超 类 型 通过 线 与 一 个 圆 连 起 来 ， 圆 
通过 连 线 依次 与 每 一 个 已 定义 的 子 类 型 连 起 来 。 每 一 个 子 类 型 与 圆 之 间 的 连 线 上 的 U 状 符号 表 
示 子 类 型 是 超 类 型 的 一 个 子 集 ， 也 表示 了 子 类 型 / 超 类 型 联系 的 方向 。 

被 所 有 实体 共享 的 属性 (包括 标识 符 ) 都 与 超 类 型 相关 联 。 特 定 的 子 类 型 所 独 有 的 属性 与 
该 子 类 型 相关 联 。 随 着 本 章 的 介绍 ， 我 们 会 在 这 些 符 号 中 加 入 其 他 的 部 分 ， 为 超 类 型 / 子 类 型 
联系 提供 更 丰富 的 含义 。 

1. 例子 

我 们 使 用 一 个 简单 但 是 常用 的 例子 来 说 明 超 类 型 / 子 类 型 联系 。 假 定 一 个 组 织 有 三 种 基本 
类 型 的 员工 : 钟点 工 、 受 薪 员 工 和 顾问 。 每 种 类 型 员工 的 一 些 重要 属性 列举 如 下 : 

* 钟点工: Employee_Number、Employee_Name、Address、Date_Hired、Hourly_Rate。 

“ 受 薪 员 工 : Employee_Number、Employee_Name、Address、Date_Hired、Annual_Salary、 

Stock_Option 。 

* 顾问: Employee_Number、Employee_Name、Address、 Date_Hired、Contract_Number、 

Billing_Rate 。 

注意 ， 所 有 的 员工 类 型 都 有 几 个 共同 的 属性 : Employee_Number、 Employee_Name.、 
Address、Date_Hired。 另 外 ， 每 一 个 类 型 都 有 一 个 或 多 个 与 其 他 类 型 属性 不 同 的 属性 〈 例 如， 
只 有 钟点 工 考 有 Hourly_Rate 属 性 ) 。 如 果 在 这 种 情形 下 开发 一 个 概念 的 数据 模型 ， 你 应 该 考虑 
下 面 三 种 情况 : 

1) 仅 定义 一 个 实体 类 型 ， 即 EMPLOYEE。 尽 管 这 种 方式 在 概念 上 简单 ， 但 具有 一 个 缺点 ， 
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即 EMPLOYEE 会 包含 三 种 类 型 员工 的 所 有 属性 。 例 如 ， 对 一 个 钟点 工 的 实例 来 说 ， 不 会 应 用 
Annual_Salary 和 Contract_Number 这 样 的 属性 ， 这 些 属性 将 会 是 空 值 (null) ， 或 也 不 会 用 到 。 
当 运 用 到 开发 环境 的 时 候 ， 使 用 该 实体 类 型 的 程序 要 处 理 很 多 变形 ， 势 必 会 非常 复杂 。 

2) 为 三 个 实体 分 别 定义 不 同 的 实体 类 型 。 这 种 方法 将 不 能 利用 员工 的 公共 性 质 ， 并 且 当 用 
户 使 用 系统 时 ， 不 得 不 仔细 选择 正确 的 实体 类 型 。 

3) 定义 一 个 称 为 EMPLOYEE 的 超 类 型 ， 它 具有 子 类 型 HOURLYEMPLOYEE、SALARIED 
EMPLOYEE 和 CONSULTANT。 这 种 方法 利用 了 所 有 员工 的 公共 性 质 ， 也 能 识别 出 每 一 种 类 型 
不 同 的 性 质 。 


所 有 实体 共 
学 的 属性 


般 实 体 
类 型 








< 下] 特定 的 子 
类 型 版 本 






仅 子 类 型 1 所 
具有 的 属性 








仅 子 类 型 2 所 
其 有 的 属性 


图 4-1 子 类 型 / 超 类 型 联系 的 基本 符号 


图 4-2 使 用 增强 型 实体 -联系 图 符号 ,给 出 了 EMPLOYEE 类 型 及 其 三 个 子 类 型 的 表示 。 被 


所 有 员工 共享 的 属性 与 EMPLOYEE 实 体 类 型 相关 联 ， 每 个 子 类 型 特有 的 属性 仅 被 那个 子 类 型 
所 包含 。 


2. 属 性 继承 
子 类 型 本 身 是 一 种 实体 类 型 。 子 类 型 的 实体 实例 表示 超 类 型 中 同样 的 实体 实例 。 例 如 ， 如 
果 “Therese Jones” 出 现在 CONSULTANT 子 类 型 中 ， 那 么 这 个 人 必定 出 现在 超 类 型 EMPLOYEE 
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中 。 结 果 ， 子 类 型 中 的 实体 不 仅 拥 有 自己 的 属性 值 ， 也 同时 拥有 超 类 型 中 的 属性 值 。 


Employee_Name Address 
Employee_Number EMPLOYEE 


| ， 
~ 


HOURLY SALARIED 
EMPLOYEE EMPLOYEE CONSULTANT 
Hourly_Rate Annual_Salary Stock_Option Biling_Rate 


图 4-2 具有 三 个 子 类 型 的 员工 超 类 型 


属性 继承 ( attribute inheritance) 是 指 一 种 性 质 ， 即 子 类 型 实体 继承 超 类 型 所 有 的 属性 值 。 
这 个 重要 性 质 使 得 子 类 型 没有 必要 重复 包含 超 类 型 的 属性 。 例 如 ，Employee_Name 是 
EMPLOYEE 的 一 个 属性 ( 见 图 4-2)， 而 不 是 EMPLOYEE 的 子 类 型 的 属性 。 因 此 ， 员工 的 名 字 
“Therese Jones” 是 从 超 类 型 EMPLOYEE 继 承 而 来 的 。 但 是 ， 该 员工 的 Billing_Rate 是 其 子 类 型 
CONSULTANT 的 一 个 属性 。 

我 们 已 经 建立 起 这 样 的 概念 : 一 个 子 类 型 的 实例 必定 是 一 个 超 类 型 的 实例 。 反 过 来 是 否 成 
7 呢 ?也 就 是 说 ， 超 类 型 的 实例 是 否 也 是 一 个 (或 更 多 ) 子 类 型 的 实例 呢 ? 可 能 是 这 样 ， 也 
可 能 不 是 这 样 ， 这 要 取决 于 具体 的 业务 情形 。 在 本 章 后 面 的 部 分 ， 我 们 会 讨论 各 种 各 样 的 可 
能 性 。 

3. 什 么 时 候 使 用 超 类 型 / 子 类 型 联系 

是 否 使 用 超 类 型 / 子 类 型 联系 是 数据 建 模 者 在 每 一 种 情形 下 必须 做 出 的 决定 。 当 下 面 的 任 
一 种 (或 两 种 ) 情况 出 现时 ， 应 当 考 虑 使 用 子 类 型 。 

1) 存在 一 些 属性 适用 于 一 些 (而 不 是 全 部 ) 实体 类 型 的 实例 。 例 如 ， 图 4.2 的 EMPLOYEE 
实体 类 型 。 

2) 子 类 型 的 实例 参与 仅 属于 该 子 类 型 的 联系 。 

图 4-3 是 使 用 子 类 型 联系 说 明 以 上 两 种 情况 的 例子 。 医 院 的 实体 类 型 PATIENT 具有 两 个 子 
类 型 : OUTPATIENT 和 RESIDENT PATIENT ( 主键 是 Patient_ID ) 。 所 有 的 病人 都 具有 
Admit_Date 以 及 Patient_Name 属 性 。 同 时 ， 每 一 个 病人 都 由 RESPONSIBLE PHYSICIAN 治 疗 ， 
RESPONSIBLE PHYSICIAN 制 定 病人 的 治疗 计划 。 
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每 一 个 子 类 型 都 具有 自己 特有 的 属性 。 例 如 ， 门 诊 病人 有 Checkback_Date 属 性 ， 住 院 病人 
有 Date_Discharged 属 性 。 同 样 ， 住 院 病人 具有 特定 的 联系 : 给 每 一 个 病人 分 配 床位 (注意 ， 这 
是 强制 联系 )。 每 一 个 床位 可 能 分 配给 病人 也 可 能 没有 分 配给 病人 。 

前 面 我 们 讨论 了 属性 继承 的 性 质 。 因 此 ， 每 个 门诊 病人 和 住院 病人 继承 了 超 类 型 PATIENT 
的 属性 : Patient_ID 、Patient_Name 以 及 Admit_Date。 图 4-3 也 说 明了 联系 继承 的 原理 。 
OUTPATIENT 和 RESIDENT PATIENT 也 是 PATIENT 的 实例 。 因此， 每 个 病人 都 和 
RESPONSIBLE PHYSICIAN 有 Is_cared_for 联 系 。 


Physician_ID 





RESPONSIBLE 

人 > 放 ~ 

PATIENT [>© ts_cared_for PHYSICIAN 
Patient_Name OO 


RESIDENT 、 | 
OUTPATIENT PATIENT © BED 


Checkback_Date Date_Discharged Bed_ID 





图 4-3 医院 中 的 超 类 型 / 子 类 型 联系 
4.3.2 特 化 和 概 化 的 表示 

我 们 已 经 描述 并 说 明了 超 类 型 / 子 类 型 联系 的 基本 原理 ， 包 括 “ 好 ”的 子 类 型 的 特征 。 但 
是 在 开发 现实 世界 的 数据 模型 时 ， 如 何 把 握 利 用 超 类 型 / 子 类 型 联系 的 时 机 呢 ? 有 两 种 过 程 可 
以 作为 开发 超 类 型 / 子 类 性 联系 的 概念 模型 一 一 概 化 和 特 化 。 

1. 概 化 

人 类 智力 的 独特 之 处 在 于 具备 将 对 象 分 类 、 概 括 其 性 质 的 能 力 、 本 能 和 经 验 。 在 数据 建 模 
过 程 中 ， 概 化 (generalization) 是 从 一 些 更 为 具体 的 实体 类 型 中 定义 更 一 般 实体 类 型 的 过 程 。 
因此 ， 概 化 是 自 底 向 上 的 过 程 。 

图 4-4 给 出 了 概 化 的 例子 。 在 图 4-4a 中 ， 定 义 了 三 个 实体 类 型 ，CAR、TRUCK 以 及 
MOTORCYCLE。 这 时 ， 数 据 建 模 人 员 想 在 E-R 图 中 单独 表示 这 些 实体 。 但 是 ， 经 过 仔细 检查 ， 
发 现 三 个 实体 类 型 有 一 些 共 同 的 属性 : Vehicle_ID (标识 符 )、 Vehicle_Name( 包 括 Make 和 
Model 两 部 分 )、Price 以 及 Engine_Displacement。 这 个 事实 (由 于 存在 一 个 公共 的 标识 符 而 得 到 
支持 ) 表明 三 个 实体 类 型 中 的 每 一 个 都 是 更 为 一 般 的 实体 类 型 的 一 个 特例 。 

这 个 更 为 一 般 的 实体 类 型 (命名 为 VEHICLE) 以 及 导致 的 超 类 型 / 子 类 型 联系 在 图 4-4b 中 
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给 出 。 实 体 CAR 具 有 特定 的 属性 No_of_Passengers, TRUCK 具有 两 个 特定 的 属性 : Capacity 以 
及 Cab_Type。 因 此 ， 概 化 允许 我 们 将 实体 类 型 及 其 公共 属性 组 合 在 一 起 ， 同 时 保持 每 一 个 子 
类 型 特定 的 属性 。 





b) 超 类 型 VEHICLE 的 概 化 
图 4-4 概 化 的 例子 
注意 ,实体 类 型 MOTORCYCLE 并 没有 包含 在 联系 中 。 仅 仅 是 疏忽 吗 ? 不 是 ， 这 是 有 意 的 ， 
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因为 它 不 满足 前 面 讨 论 的 子 类 型 条 件 。 比 较 图 4-4 中 的 a 和 b， 读 者 会 发 现 MOTORCYCLE 的 属 
性 正 是 所 有 VEHICLE 的 共有 属性 ; 摩托 车 没有 和 白 已 特 有 的 属性 。 再 者 ，MOTORCYCLE 与 其 
他 实体 类 型 之 间 没 有 联系 。 因 此 ， 没 有 必要 创建 MOTORCYCLE 子 类 型 。 

没有 MOTORCYCLE 子 类 型 的 事实 表明 ，- - 定 存 在 一 个 VEHICLE 的 实例 不 是 任何 子 类 型 
的 实例 。 我 们 将 在 说 明 约 束 的 那 一 节 中 讨论 这 种 类 型 的 约束 。 

2. 特 化 

如 前 所 述 ， 概 化 是 自 底 向 上 的 过 程 ， 那 么 ， 特 化 与 概 化 的 方向 相反 ， 是 自 顶 向 下 的 过 程 。 
假如 已 经 定义 了 实体 类 型 及 其 属性 ， 特 化 (specialization ) 是 从 超 类 型 定义 一 个 或 多 个 超 类 型 
的 子 类 型 ， 并 形成 超 类 型 / 子 类 型 联系 的 过 程 。 每 一 个 子 类 型 都 是 基于 一 些 不 同 的 特征 而 形成 ， 
如 子 类 型 特有 的 属性 或 联系 。 

图 4-5 给 出 了 特 化 的 一 个 例子 。 图 4-$a 展 示 了 名 为 PART 的 实体 类 型 以 及 它 的 一 些 属性 。 其 
标识 符 是 Part_No， 其 他 属性 包括 Description 、Unit_Price、Location 、Qty_on_Hand、 
Routing_Number 以 及 Supplier (最 后 一 个 属性 是 多 值 的， 因为 一 个 零件 对 于 不 同 的 供 货 商 可 能 
有 不 同 的 单价 )。 

在 与 用 户 讨论 的 过 程 中 ， 我 们 发 现 零件 有 两 种 可 能 的 来 源 : 一些 由 内 部 加 工 ， 而 另 一 些 则 
从 外 部 的 供 货 商 处 购买 。 而 且 ， 我 们 发 现 一 些 零件 既 从 外 部 购买 ， 又 有 内 部 加 工 的 。 在 这 种 情 
况 下 ， 零 件 的 选择 依赖 于 诸如 加 工 能 力 、 零 件 单价 等 因素 。 

图 4-5a 中 的 一 些 属性 适用 于 所 有 的 零件 ， 而 不 论 其 来 源 如 何 。 但 是 ， 其 他 一 些 属性 则 和 零 
件 的 来 源 有 关 。Routing_Number 只 适用 于 加 工 的 零件 ， 而 Supplier_ ID 和 Unit_Price 只 适用 于 购 
头 的 零件 。 这 些 因素 表明 ， 应 当 通过 定义 子 类 型 MANUFACTURED PART 和 PURCHASED 
PART 特 化 PART ( 见 图 4-Sb ) 。 

华图 4-5b 中 ，Routing_Number 与 MANUFACTURED PART 相 关联 。 数 据 建 模 人 员 起 初 计划 
将 Supplier_ID 和 Unit_Price 与 PURCHASED PART 相 关联 。 但 是 ， 经 过 与 用 户 深 入 讨论 ， 他 建议 
在 PURCHASED PART 和 SUPPLIER 之 间 创 建 一 个 新 联系 。 该 联系 (在 图 4-5b 中 命名 为 Supplies) 
使 用 户 更 容易 将 购买 的 零件 和 其 供 货 商 关联 起 来 。 注 意 ， 属 性 Unit_Price 现 在 与 联系 Supplies 关 
联 ， 因 此 ， 零 件 的 单价 会 因 供 货 商 的 不 同 而 发 生变 化 。 在 该 例 中 ， 概 化 提供 了 表示 问题 领域 更 


恰当 的 方式 。 


Qty_on_Hand 





a) 实体 类 型 PART 
图 4-5 特 化 的 例子 
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< 
Supplier ID 
PART Qty_on_Hand 
， SUPPLIER 
Routing_Number ( 
Vy 
MANUFACTURED PURCHASED | 人、 
PART PART 一 


b) 特 化 为 MANUFACTURED PART 和 PURCHASED PART 


图 4-5 ( 续 ) 











3. 将 概 化 和 特 化 结合 起 来 

特 化 和 概 化 都 是 开发 超 类 型 / 子 类 型 联系 的 有 用 技术 。 在 特定 的 时 刻 用 什么 样 的 技术 取决 
于 多 个 因素 ， 如 问题 领域 的 本 质 ， 先 前 的 建 模 工 作 ， 个 人 喜好 。 读 者 应 该 准备 同时 使 用 两 种 技 
术 ， 并 根据 前 面 提 到 的 因素 ， 交 赫 使 用 这 两 种 技术 。 


4.4 指定 超 类 型 / 子 类 型 联系 之 间 的 约束 


迄今 为 止 ， 我 们 已 经 讨论 了 超 类 型 / 子 类 型 联系 的 基本 概念 ， 并 介绍 了 一 些 基 本 的 符号 来 
表示 这 些 基本 概念 。 我 们 也 论述 了 概 化 和 特 化 的 过 程 ， 以 便 帮 助 数 据 建 模 者 把 握 利用 这 些 联系 
的 机 会 。 本 节 将 介绍 表示 超 类 型 / 子 类 型 联系 上 的 约束 的 其 他 符号 。 这 些 约束 使 我 们 能 够 捕获 
一 些 应 用 这 些 联系 的 重要 业务 规则 。 本 节 所 论述 的 两 个 最 重要 约束 类 型 是 完备 性 约束 和 不 相交 
约束 (Elmasri 和 Navathe, 1994 ) 。 

4.4.1 指定 完备 性 约束 

完备 性 约束 (completeness constraint) 解决 以 下 问题 : 是 否 一 个 超 类 型 的 实例 必须 至 少 是 
一 个 子 类 型 的 实例 。 完 备 性 约束 有 两 个 可 能 的 规则 : 完全 特 化 和 部 分 特 化 。 完 全 特 化 规则 
(total specialization rule ) 说 明 超 类 型 的 每 一 个 实体 实例 必须 是 联系 中 一 些 子 类 型 的 一 个 实例 。 
部 分 特 化 规则 (partial specialization rule) 说 明了 超 类 型 的 实体 实例 可 以 不 属于 任何 子 类 型 。 
我 们 用 本 章 前 面 的 例子 来 说 明 这 两 个 规则 ( 见 图 4-6)。 

1 .完全 特 化 规则 

图 4-6a 重 复 了 PATIENT 例子 ( 见 图 4-3) 并 引入 完全 特 化 规则 的 符号 。 在 这 个 例子 中 ， 业 务 
规则 如 下 一 个 病人 必须 是 门诊 病人 或 是 住院 病人 (在 这 个 医院 中 没有 其 他 类 型 的 病人 )。 完 
全 特 化 规则 使 用 从 PATIENT 实体 类 型 连 到 圆 的 双 线 表 示 。 

在 这 个 例子 中 ， 每 次 在 超 类 型 中 插入 一 个 新 的 PATIENT 的 实例 ， 就 会 在 OUTPATIENT 或 
RESIDENT PATIENT 中 插入 相应 的 实例 。 如 果 在 RESIDENT PATIENT 中 插入 实例 ， 则 会 创建 
联系 ls_assigned 的 实例 ， 以 便 给 这 个 病人 分 配 一 个 床位 。 
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2. 部 分 特 化 规则 

图 4-6b 重 复 了 图 4-4 中 VEHICLE 及 其 子 类 型 CAR 和 TRUCK 的 例子 。 回 忆 一 下 ， 在 这 个 例子 
中 ， 摩 托 车 是 一 种 交通 工具 ， 但 是 并 没有 将 它 表示 为 数据 模型 中 的 一 个 子 类 型 。 因 而 ， 如 果 一 
个 交通 工具 是 小 轿车 ， 那 么 它 必 是 CAR 的 实例 ， 如 果 是 卡车 ， 那 么 它 必 是 TRUCK 的 实例 。 但 
是 ， 如 果 一 个 交通 工具 是 摩托 车 ， 那 么 它 不 能 作为 任何 子 类 型 的 实例 。 这 是 部 分 特 化 的 例子 ， 
由 从 超 类 型 VEHICLE 到 圆 的 单线 表示 。 _ 


Patient_!D Admit_Date Physician_ID 


RESPONSIBLE 
~ A 
PATIENT p>© PHYSICIAN 
RESIDENT ~ - 
OUTPATIENT PATIENT © is_assigned | 
Checkback_Date Date_Discharged 是 


a) 完全 特 化 规则 


~“) : 
Vehicle_ID _Engine_ 
Displacement 
Vehicle_Name 


Cm ) VEHICLE 
| Cab_Type 


CAR TRUCK 


b) 部 分 特 化 规则 
图 4-6 完备 性 约束 示例 





E 











4.4.2 指定 不 相交 约束 

不 相交 约束 (disjointness constraint) 解决 这 样 的 问题 : 一 个 超 类 型 的 实例 是 否 可 以 同时 是 
两 个 (或 多 个 ) 子 类 型 的 实例 。 不 相交 约束 有 两 个 可 能 的 规则 : 不 相交 规则 和 交 肥 规则 。 不 相 
交规 则 (disjoint rule) 指定 如 果 一 个 〈 超 类 型 ) 的 实体 实例 是 一 个 子 类 型 的 实例 ， 那 么 它 不 能 
同时 是 任何 其 他 子 类 型 的 实例 。 交 又 规则 (overlap rule) 指定 一 个 实体 实例 可 以 同时 是 两 个 
(或 多 个 ) 子 类 型 的 实例 。 图 4-7 给 出 了 每 一 种 规则 的 例子 。 

1. 不 相交 规则 

图 4-7a 显 示 了 图 4-6a 中 的 PATIENT 的 例子 。 在 这 种 情况 下 ， 其 业务 规则 如 下 : 在 任何 给 定 
时 间 ， 对 于 任何 一 个 病人 ， 要 么 是 门诊 病人 ， 要 么 是 住院 病人 ， 但 不 能 两 者 都 是 。 这 样 的 业务 
规则 就 是 不 相交 规则 ， 它 用 写 在 连接 超 类 型 和 子 类 型 的 圆 中 的 字母 “d” 表 示 。 注 意 ， 在 这 个 
图 中 ，PATIENT 的 子 类 会 随时 间 而 变化 ， 但 是 . 在 任何 给 定 的 时 间 ， 一 个 PATIENT 只 能 是 一 种 
类 型 。 

2. 交 重 规则 

图 4-7b 说 明了 实体 类 型 PART 及 其 两 个 子 类 型 MANUFACTURED PART 和 PURCHASED 
PART ( 见 图 4-5b)。 回 忆 一 下 对 这 个 例子 所 作 的 讨论 ， 一 些 零件 可 以 同时 是 加 工 零 件 和 外 购 零 
件 。 我 们 需要 对 这 句 话 再 进行 一 下 说 明 。 在 这 个 例子 中 ，PART 的 一 个 实例 是 特定 的 零件 号 
( 即 零件 的 型 号 )， 而 不 是 某 个 零件 (零件 通过 标识 符 说 明 ， 即 Part_No)。 例 如 ， 考 虑 零件 号 
4000。 在 某 时 刻 ， 这 种 零件 可 能 有 250 个 ， 其 中 ，100 个 是 加 工 的 零件 ， 余 下 的 150 个 是 外 购 的 
零件 。 在 这 种 情况 下 ， 并 不 需要 关注 个 别 的 零件 。 当 需要 关注 单个 零件 时 ， 给 每 一 个 零件 分 配 
个 序列 号 标识 符 ， 并 依据 它 是 否 存在 ， 将 其 数量 赋 为 1 或 0。 

将 字母 o 放 在 圆 内 来 表示 交 亚 规则 ， 如 图 4-7b 所 示 。 注 意 ， 该 图 也 说 明了 完全 特 化 规则 
(用 双 线 表示 )。 因 此 ， 零 件 可 以 是 加 工 零件 或 外 购 零件 ， 也 可 能 既是 加 工 零 件 又 是 外 购 零 件 。 


-、 7 
~、 RESPONSIBLE 
FATIENT p>9 PHYSICIAN 
a 
RESIDENT A、 . 
OUTPATIENT ED © | 
Checkback_Date Date_Discharged Bed_ID 


a 不 相交 规则 
图 4-7 不 相交 约束 例子 
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Routing_Number 





SUPPLIER 























MANUFACTURED PURCHASED |、 
PART PART | 天 一 
b) 交大 规则 
图 4-7 ( 续 ) 


4.4.3 定义 子 类 型 鉴别 符 

假如 有 一 个 子 类 型 / 超 类 型 联系 ， 考 虑 这 样 的 问题 : 插入 一 个 新 的 超 类 型 实例 。 这 个 实例 
将 插入 哪个 子 类 型 中 呢 ? 我 们 已 经 讨论 了 适用 于 这 种 情况 的 各 种 规则 ， 我 们 需要 一 个 简单 的 机 
制 来 实现 这 些 规则 (如果 存在 的 话 )。 通 常 使 用 子 类 型 鉴别 符 来 完成 这 样 的 任务 。 子 类 型 鉴别 
符 (subtype discriminator) 是 超 类 型 的 一 个 属性 ， 其 值 决 定 了 目标 类 型 和 子 类 型 。 

1. 不 相交 子 类 型 

图 4-8 给 出 使 用 子 类 型 鉴别 符 的 例子 。 该 例子 说 明了 图 4-2 介 绍 的 EMPLOYEE 超 类 型 及 其 子 
类 型 。 注 意 ， 下 面 的 约束 已 经 加 入 该 图 : 完全 特 化 和 不 相交 子 类 型 。 因 此 ， 每 一 个 员工 必须 是 
钟点 工 、 受 新 员工 或 顾问 的 一 种 。 

超 类 型 中 已 加 入 了 一 个 新 的 属性 (Employee_Type) 作为 子 类 型 鉴别 符 。 当 超 类 型 中 加 
入 新 的 员工 时 ， 将 该 属性 的 值 编码 为 下 面 三 个 值 中 的 一 个 : “H”( 用 来 表示 钟点 工 )、“S” 
(用 来 表示 受 薪 员工 ) 或 “C”( 用 来 表示 顾问 )。 根 据 这 样 的 编码 ， 将 实例 指派 为 合适 的 子 类 
型 。 

图 4-8 也 说 明了 用 来 表示 子 类 型 鉴别 符 的 符号 。 表 达 式 “Employee_Type=”( 放 在 条 件 语 句 
的 左边 ) 放 在 从 超 类 型 到 圆 的 连 线 的 旁边 ,选择 合适 子 类 型 的 属性 值 (在 该 例 中 , 其 值 是 “H”、 
“S” 或 “C”) 放 在 指向 子 类 型 的 连 线 旁 边 。 因 此 ， 对 于 这 个 例子 ， 条件 “Employee_Type =S” 
使 得 实体 实例 插入 到 SALARIED EMPLOYEE 子 类 型 中 。 

2. 交 登 子 类 型 

当 子 类 型 交合 时 ,必须 对 子 类 型 鉴别 符 作 稍 许 修改 。 其 原因 是 对 于 一 个 给 定 的 超 类 型 实例 ， 
可 能 需要 在 多 个 子 类 型 中 创建 实例 。 

图 4-9 说 明了 PART 及 其 交 和 鸽子 类 型 的 例子 。 PART 中 已 经 加 入 了 名 为 Part_Type 的 新 属性 。 
Part_Type 是 一 个 由 Manufactured? 和 Purchased? 组 成 的 复合 属性 ， 其 中 的 每 一 个 属性 都 是 布尔 
变量 〈 即 只 能 具有 值 “Y” 或 “N” )。 当 PART 中 加 入 一 个 新 的 实例 时 ，Part_Type 的 组 成 部 分 的 
值 如 下 : 


部 件 零 件 的 类 型 Manufactured? Purchased? 
仅 加 工 “yy” «N” 
仅 购 买 “<N” “yy 
购 灭 且 加 工 “Y>” ay” 








Address 
Employee_Name 
Employee_Number EMPLOYEE Date_Hired 


'| Employee_Type= 


HOURLY 
EMPLOYEE 


SALARIED CONSULTANT 


EMPLOYEE 


Annual_Salary Stock_Options Billing_Rate 


图 4-8 引入 子 类 型 鉴别 符 (不 相交 规则 ) 


Manufactured? Purchased? 





Description 


人 








MANUFACTURED PURCHASED 上 __~ 
PART PART SS Supplies 


图 4-9 子 类 型 鉴别 符 ( 交 码 规则 ) 
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图 4-9 说 明了 为 这 个 例子 指定 子 类 型 鉴别 符 的 方法 。 注 意 ， 该 方法 可 以 用 于 任何 数目 的 交 
合子 类 型 。 

4.4.4 定义 超 类 型 / 子 类 型 层次 

本 章 已 经 讨论 了 一 些 超 类 型 / 子 类 型 联系 的 例子 。 对 于 这 些 例子 中 的 任何 子 类 型 ， 半 有 可 
能 在 其 上 定义 其 他 子 类 型 (在 这 种 情况 下 ， 子 类 型 变 为 新 定义 的 子 类 型 的 超 类 型 )。 超 类 型 / 
子 类 型 层次 (supertype/subtype hierarchy ) 是 指 超 类 型 和 子 类 型 层次 的 层次 安排 ， 其 中 ， 每 一 
个 子 类 型 只 有 一 个 超 类 型 (Elmasri 和 Navathe ，1994)。 

本 节 给 出 了 一 个 超 类 型 / 子 类 型 层次 的 例子 ( 见 图 4-10)。 这 个 例子 包含 了 本 章 迄 今 使 用 的 
大 部 分 概念 和 符号 。 同 时 也 给 出 了 可 以 在 大 多 数 建 模 情 况 下 使 用 的 方法 学 (基于 特 化 )。 

1. 例子 

假定 要 求 你 构建 一 个 大 学 人 力 资 源 的 模型 。 使 用 特 化 《 自 顶 向 下 的 方法 )， 你 可 能 按照 下 
面 过 程 进行 : 从 层次 的 顶层 开始 ， 先 建 模 最 一 般 的 实体 类 型 。 在 这 种 情况 下 ， 最 一 般 的 实体 类 
型 是 PERSON。 列 出 PERSON 所 有 的 属性 。 图 4-10 给 出 的 属性 有 : SSN (标识 符 )、Name、 
Address、Gender 和 Date_of _Birth。 有 时 也 将 顶层 的 实体 类 型 称 为 根 (root )。 

下 一 步 ， 定 义 根 的 所 有 主要 子 类 型 。 在 该 例 中 ，PERSON 的 子 类 型 有 三 个 : EMPLOYEE 
(在 大 学 工作 的 人 )、STUDENT( 在 大 学 上 课 的 人 )、ALUMNUS( 已 经 毕业 的 人 )。 假 定 没 有 该 大 
学 感 兴趣 的 其 他 类 型 的 人 , 完全 特 化 规则 的 应 用 如 图 所 示 。 一 个 人 可 能 属 干 多 个 了 类 型 (例如 ， 
EMPLOYEE 和 ALUMNUS)， 因 此 ， 使 用 了 交 香 规则。 注意 ， 交 释 规 则 允许 任何 交 蔡 (一 个 
PERSON 可 能 同时 是 任何 两 个 或 所 有 三 个 子 类 型 )。 如 果 不 允 许 进行 某 些 组 合 ， 那 么 意味 着 要 
开发 更 为 精细 的 超 类 型 / 子 类 型 层次 以 消除 不 允许 的 结合 。 

图 中 表明 了 特定 的 属于 每 一 个 子 类 型 的 属性 。 因 而 每 一 个 EMPLOYEE 的 实例 都 有 Date_ 
Hired 和 Salary 的 值 。Major_Dept 是 STUDENT 的 一 个 属性 ， 而 Degree (具有 组 件 Year、 
Designation 和 Date) 是 ALUMNUS 的 一 个 属性 。 

下 一 步 是 评估 任何 已 定义 的 子 类 型 需要 作 进 一 步 的 特 化 处 理 。 在 这 个 例子 中 ,将 
EMPLOYEE 分 为 两 个 子 类 型 : FACULTY 和 STAFF 。 FACULTY 具 有 特定 的 属性 Rank， 而 
STAFF 具 有 特定 的 属性 Position。 注 意 ， 在 这 个 例子 中 ， 子 类 型 EMPLOYEE 变 成 了 FACULTY 
和 STAFF 的 超 类 型 。 因 为 除了 教师 和 职员 外 ， 可 能 会 有 其 他 员工 类 型 ( 如 助教 )， 这 意味 着 存 
在 部 分 特 化 规则 。 但 是 ， 一 个 员工 不 可 能 同时 是 教师 和 职员 。 因 此 ， 在 圆 中 应 说 明 不 相交 规则 
(用 “d” 表 示 )。 

为 STUDENT 定义 了 两 个 子 类 型 : GRADUATE STUDENT 和 UNDERGRAD STUDENT 。 
UNDERGRAD STUDENT 具有 属性 Class_Standing , GRADUATE STUDENT 具有 属性 Test_ 
Score。 注 意 ， 指 定 了 完全 特 化 规则 和 不 相交 规则 ， 你 应 该 能 够 叙述 这 些 约束 的 业务 规则 。 

2. 超 类 型 / 子 类 型 层次 的 小 结 

注意 ， 图 4-10 所 示 层 次 中 包含 关于 属性 约束 的 两 个 特性 。 

1) 在 该 层次 中 ， 尽 可 能 将 属性 分 配 在 最 高 逻辑 层 。 例 如 ， 因 为 SSN ( 即 社会 安全 号 ) 适用 
于 所 有 的 人 ， 所 以 将 其 分 配 到 根 上 。 另 一 方面 ， Date_Hired 属 性 只 适用 于 员工 ， 因 此 ， 仅 分 配 
给 EMPLOYEE 作 为 属性 。 这 种 方法 确保 尽 仅 可 能 多 的 子 类 型 共享 属性 。 

2) 在 该 层次 中 ， 较 低层 的 子 类 型 不 仅 从 它 的 直接 超 类 型 中 继承 属性 ， 而 且 从 层次 中 较 高 层 
中 的 所 有 超 类 型 中 继承 属性 。 例 如 ，FACULTY 的 一 个 实例 具有 下 列 属性 值 ， SSN、Name、 
Address、Gender 和 了 Date_of Birth (从 PERSON 中 继承 )、 Date_Hired 和 Salary (从 EMPLOYEE 
中 继承 ) 以 及 Rank (从 FACULTY 中 继承 的 属性 )。 








在 本 章 最 后 的 案例 研究 中 ， 会 要 求 你 使 用 本 节 介 绍 的 过 程 、 开 发 一 个 关于 山 景 社区 医院 的 


增强 型 E-R 图 。 
下、 Ce ) 


Ce ) 了 on 
EMPLOYEE ALUMNUS STUDENT 


Date_Hired 
Degree 














UNDERGRAD 
图 4-10 超 类 型 / 子 类 型 层次 的 例子 
4.5 增强 型 EER 建 模 示例 : 松 谷 家 具 公司 


第 3 章 给 出 了 松 谷 家 具 公 司 E-R 图 的 例子 (图 4-11 重 复 了 该 图 )。 在 研究 该 图 之 后 
第 云图 )。 辫 ， 可 用 一 
些 问 题 来 帮助 你 淤 清 实体 和 联系 的 含义 。 其 中 三 个 问题 是 : 
1) 为 什么 所 有 的 顾客 不 在 一 个 或 多 个 销售 区 域内 进行 交易 ? 
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2) 为 什么 一 些 员 工 没 有 管理 其 他 员工 ， 为 什么 他 们 没有 受 其 他 员工 的 管理 ”为 什么 一 些 员 
工 没有 在 加 工 中 心 工 作 ? 

3) 为 什么 并 不 是 所 有 的 供 货 商都 为 松 谷 家 县 公司 提供 原材料 ? 

可 能 还 有 其 他 问题 ， 但 我 们 将 关注 这 三 个 问题 ， 来 说 明 如 何 用 超 类 型 / 子 类 型 联系 传达 更 
为 特定 的 (语义 更 为 丰富 的 ) 数据 模型 。 

对 上 面 问 题 进 行 一 些 研究 后 ， 我 们 发 现 适 用 于 松 谷 家 具 公 司 完成 业务 的 如 下 业务 规则 : 

1) 有 两 种 类 型 的 顾客 : 普通 顾客 和 全 国 性 顾客 。 只 有 普通 顾客 在 销售 区 内 进行 交易 。 当 且 
仅 当 至 少 一 个 普通 顾客 与 一 个 销售 区 关联 时 ， 该 销售 区 域 才 会 存在 。 每 一 个 全 国 性 顾客 与 一 个 
账户 经 理 相 关联 。 存 在 这 种 可 能 性 : 一 个 顾客 既是 普通 顾客 又 是 全 国 性 顾客 。 

2) 存在 两 种 特定 类 型 的 员工 : 管理 人 员 和 工人 。 仅 工人 在 加 工 中 心 工 作 ， 管 理 人 员 管 理工 
人 。 也 存在 管理 人 员 和 工人 之 外 的 其 他 类 型 员工 。 工 人 可 以 晋升 为 管理 人 员 ， 这 时 ， 该 员工 不 
再 是 工人 。 

3) 松 谷 家 县 公司 会 关注 很 多 不 同 的 销售 商 并 不 是 所 有 的 销售 商都 曾 为 公司 提供 原材料 。 
一 旦 销售 商 变 为 原材料 的 正式 供 货 商 ， 便 与 一 个 合同 号 相关 联 。 

上 述 业 务 规则 用 于 将 图 4-11 修 改 为 图 4-12 (除了 与 所 发 生 的 变化 有 本 质 关系 的 属性 外 ， 该 
图 省 略 了 大 部 分 的 属性 )。 规 则 1 意味 着 从 CUSTOMER 到 REGULAR CUSTOMER 和 NATIONAL 
ACCOUNT CUSTOMER ， 存 在 着 完全 、 交 登 特 化 。 CUSTOMER 的 复合 属性 Customer_Type 用 
于 说 明 一 个 顾客 实例 是 普通 顾客 、 全 国 性 顾客 还 是 两 者 都 是 。 因 为 ， 只 有 普通 顾客 在 销售 区 域 
内 完成 业务 ， 因 此 ， 只 有 普通 顾客 涉及 Does_business_in 联 系 ; 并 且 因 为 一 个 销售 区 域 要 存在 ， 
必须 至 少 有 一 个 普通 顾客 ， 所 以 普通 顾客 旁边 的 最 小 基数 是 1。 

规则 2 意味 着 存在 一 个 部 分 的 、 不 相交 的 特 化 ， 将 EMPLOYEE 特 化 为 MANAGEMENT 
EMPLOYEE 和 UNION EMPLOYEE。 EMPLOYEE 的 属性 Employee_Type 用 来 区 分 两 种 特定 类 
型 的 员工 。 特 化 之 所 以 是 部 分 的 ， 是 因为 除了 这 两 种 类 型 的 员工 外 ， 还 有 其 他 类 型 的 员工 。 仅 
工人 涉及 到 Works_in 联 系 ， 但 是 ， 所 有 的 工人 在 同一 个 加 工 中 心 工 作 ， 因 此 ，WORK 
CENTER 的 Works_in 的 最 小 基数 是 强制 的 。 由 于 一 个 员工 不 能 同时 是 管理 人 员 和 工人 ， 因 此 ， 
特 化 是 不 相交 的 。 

规则 3 意味 着 有 一 个 VENDOR 到 SUPPLIER 的 部 分 特 化 ， 因 为 仅 有 一 些 销售 商会 变 成 供 货 
商 。 供 货 商 (而 不 是 销售 商 ) 具有 合同 号 。 由 于 VENDOR 只 有 一 个 子 类 型 ， 因 此 没有 必要 指 
定 不 相交 或 交 策 规则 。 由 于 所 有 的 供 货 商 供应 原材料 ，RAW MATERIAL 在 Supplies 联 系 中 的 最 
小 基数 是 1。 

以 上 例子 表明 ， 一 旦 理解 了 实体 的 概 化 / 特 化 ， 就 知道 如 何 将 E-R 图 转换 为 EER 图 。 在 数据 
模型 中 不 仅 可 以 包括 超 类 型 和 子 类 型 实体 ， 而 且 还 可 加 入 额外 的 属性 (如 鉴别 符 属性 )， 改 变 
最 小 基数 (从 可 选 到 强制 )， 以 及 将 联系 从 超 类 型 移 向 子 类 型 。 

这 时 刚好 强调 一 下 前 面 讨论 过 的 关于 数据 建 模 的 一 个 要 点 。 数 据 模型 是 组 织 所 需要 数据 的 
概念 图 。 数 据 模型 与 实现 的 数据 库 元 素 并 不 是 一 一 映射 关系 。 例 如 ， 读 者 熟悉 的 数据 库 产品 
Access， 尽 管 SUPPLIER 是 实体 类 型 而 Supplies 是 联系 ， 但 两 者 在 Access 数 据 库 中 都 以 表 的 形式 
出 现 。 现 在 ， 这 些 细节 并 不 重要 。 现 在 的 目的 是 解释 控制 数据 的 所 有 规则 ， 并 不 是 解释 如 何 有 
效 地 存储 或 访问 要 处 理 的 信息 。 在 随后 的 章节 中 ， 当 介绍 数据 库 设 计 和 实现 时 ， 将 强调 技术 和 
效率 的 问题 。 

尽管 图 4-12 中 的 EER 图 澄清 了 一 些 问 题 ， 并 使 图 4-11 中 的 模型 更 为 清晰 ， 但 它 对 一 些 人 
来 讲 依 然 难 以 理解 。 一 些 人 并 不 对 所 有 的 数据 类 型 感 兴趣 ， 而且 一 些 人 可 能 不 需要 了 解 E-R 
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图 中 的 所 有 细节 。 下 一 节 主 要 介绍 如 何 简化 完整 的 、 清 晰 的 数据 模型 ， 以 呈现 给 特定 的 用 户 
组 成 管理 人 员 。 
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图 4-11 松 谷 家 具 公 司 的 E-R 图 
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图 4-12 松 谷 家 具 公 司 的 EER 图 
4.6 实体 聚 簇 


一 些 企业 级 的 信息 系统 有 1000 多 个 实体 类 型 和 联系 ， 如 何 将 这 样 一 个 庞大 的 组 织 数 据 图 时 
现 给 开发 人 员 和 用 户 ? 一 种 方法 是 创建 多 个 E-R 图 ， 每 一 个 图 展示 数据 模型 不 同 片段 (可 能 交 
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a) 吕 能 的 实体 聚 簇 
图 4-13 松 谷 家 具 公 司 的 实体 聚 铀 
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注 : 加 虽然 在 4.13a 中 没有 任何 说 明 ， 但 此 处 可 以 插入 表示 联系 的 攻 形 和 名 称 (如 Ordered_on )。 







b) 实体 聚 簇 的 EER 图 
图 4-13 ( 续 ) 


实体 聚焦 (Teorey, 1999) 是 展现 庞大 且 复 杂 的 组 织 的 数据 模型 的 一 个 有 用 的 方法 。 实 体 
聚 乌 (entity cluster) 是 将 一 个 或 多 个 实体 类 型 及 其 相关 属性 组 成 单个 抽象 实体 类 型 。 因 为 实 
体 聚 入 的 行为 和 实体 类 型 相似 ， 所 以 实体 聚 簇 和 实体 类 型 可 以 进一步 组 成 更 高 层 的 实体 聚 狂 。 
实体 聚 徐 是 一 个 将 数据 模型 的 宏观 视图 分 解 成 粒度 更 细 的 视图 的 层次 分 解 ， 最 终 形成 充分 的 、 
详细 的 数据 模型 。 

图 4-13 说 明了 图 4-12 所 示 的 松 谷 家 具 公司 数据 模型 的 实体 聚 秘 的 一 个 可 能 的 结果 。 图 4-13a 
在 可 能 的 实体 聚 奥 周围 画 上 虚线 ， 来 表示 完整 的 数据 模型 。 图 4-13b 给 出 了 将 详细 的 EER 图 转 
换 为 仅 有 实体 聚 乌 及 其 联系 的 EER 图 (EER 实体 联系 图 可 能 包含 实体 聚 敌 和 实体 类 型 ， 但 是 该 
图 仅 包 含 实体 聚 簇 ) 的 最 终结 果 。 该 图 中， 实体 聚 往 的 含义 如 下 : 

* SELLING UNIT 表示 SALESPERSON 和 SALES TERRITORY 实 体 类 型 和 Serves 联 系 。 

“CUSTOMER 表示 CUSTOMER 实 体 超 类 型 、 其 子 类 型 以 及 超 类 型 和 子 类 型 之 间 的 联系 。 

“ITEM SALE 表示 ORDER 实体 类 型 和 关联 实体 ORDER LINE 以 及 它们 之 间 的 联系 。 

“1TEM 表示 PRODUCT LINE 和 PRODUCT 实 体 类 型 以 及 Includes 联 系 。 

“MANUFACTURING 表示 WORK CENTER、EMPLOYEE 超 类 型 实体 、 它 的 子 类 型 以 及 

Works-in 联 系 和 Supervises 联 系 、 超 类 型 及 其 子 类 型 之 间 的 联系 (图 4-14 说 明了 实体 豪 秘 

MANUFACTURING 到 其 组 成 部 分 的 展开 )。 

“MATERIAL 表示 RAW MATERIAL 和 VENDOR 实 体 类 型 、 SUPPLIER 子 类 型 、Supplies 
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联系 以 及 VENDOR 和 SUPPLIER 之 间 的 超 类 型 / 子 类 型 之 间 的 联系 。 

图 4-13 和 4-14 中 的 实体 联系 图 可 以 向 人 们 解释 装配 过 程 和 支持 这 部 分 业务 所 需要 的 部 分 的 
言 息 的 细节 。 例 如 ， 库 存 管理 人 员 可 以 通过 图 4-13 了 解 和 到 ，MANUEFACTURING 的 数据 与 ITEM 
的 数据 相关 (通过 Produced_in 联 系 )。 另 外 ， 图 4-14 说 明了 涉及 加 工 中 心 和 员工 在 内 的 生产 过 
程 的 细节 。 库 存 管理 人 员 可 能 设 有 必要 了 解 某 些 细节 ， 例 如 ， 刀 入 SELLING UNIT 实 体 聚 签 的 
销售 结构 。 

图 4-13 中 的 实体 聚 徐 可 以 通过 下 列 方法 得 到 : 1) 通过 抽取 超 类 型 及 其 子 类 型 ( 见 
CUSTOMER 实 体 聚 徐 ); 2) 结合 直接 相关 的 实体 类 型 和 它们 之 间 的 联系 ( 见 SELLING UNIT、 
ITEM、MATERIAL 和 MANUFACTURING 实 体 聚 化)。 也 可 以 通过 结合 强 实体 及 其 相关 的 能 实 
体 类 型 得 到 实体 聚 徐 〈 本 图 没有 相关 说 明 )。 由 于 实体 聚 往 是 层次 的 ， 所 以 如 果 需 要 的 话 ， 要 
以 将 SELLNG UNIT 和 和 CUSTOMER 实体 聚 徐 以 及 联系 Does_business_in 结 合 起 来 ， 画 出 另 
实体 联系 图 ， 其 原因 是 它们 是 直接 相关 的 实体 聚 徐 。 

实体 聚 灸 应 该 关注 用 户 、 开 发 人 员 和 管理 人 员 感 兴趣 的 领域 。 将 哪些 实体 类 型 和 联系 组 成 
实体 聚 饶 取 决 于 你 的 目的 。 例 如 ， 在 关于 松 谷 家 具 公司 数据 模型 的 实体 聚焦 的 例子 中 ， 可 以 将 
ORDER 实体 类 型 放 进 CUSTOMER 实 体 聚 簇 ， 将 ORDER LINE 实 体 类 型 放 进 ITEM 实 体 聚 做 。 
这 样 的 重组 可 以 去 掉 ITEM SALE 聚 化 ， 因 为 没有 任何 一 组 人 员 对 这 个 聚 秘 感 兴趣 。 回 样 ， 针 


对 于 整个 数据 模型 不 同 的 方面 ， 可 以 构造 几 个 不 同 的 实体 聚 秘 。 
WORK 
Vv 


辐 ”” Type= 









图 4-14 _ MANUFACTURING 实体 聚 敌 


4.7 再 论 业务 规则 


我 们 已 经 了 解 到 ，E-R 图 (以 及 增强 型 E-R 图 ) 是 表达 某 些 业 务 规则 的 有 效 手 段 。 因 此 ， 
本 章 所 讨论 的 一 些 与 超 类 型 和 子 类 型 相关 的 参与 和 不 相交 约束 (disjointness )， 是 与 那些 联系 
相关 的 业务 规则 的 表达 式 。 但 是 ， 组 织 中 还 有 很 多 其 他 业务 规则 不 能 用 前 面 介 绍 的 符号 表达 。 
本 节 给 出 一 个 通用 的 业务 规则 框架 ， 并 说 明 如 何 表达 标准 的 E-R 图 (和 增强 型 E-R 图 ) 符号 所 
不 能 表示 的 一 些 重 要 类 型 的 规则 。 
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4.7.1 业务 规则 的 分 类 

有 很 多 不 同类 型 的 业务 规则 ， 第 3 章 及 本 章 都 给 出 了 一 些 例子 ， 如 关于 实体 间 联 系 的 规则 
(如 基数 值 )、 超 类 型 / 子 类 型 联系 和 关于 属性 和 实体 类 型 的 事实 (例如 ， 定义 )。 图 4-15 从 
GUIDE Business Rules Project 改 写 而 来 ， 它 给 出 了 给 业务 规则 以 及 不 同类 型 规则 之 间 共 在 联系 










分 类 的 E-R 图 。 
< 
BUSINESS 7 
RULE o> 
NS-、、 八 小 
STRUCTURAL - ACTION 、 
~ 2 Plays_ pe 
CONTEXT TERM ”此 role 癌 < FACT 
V | YA NS 
(a) (dj (a) 


中 
小 
BUSINESS COMMON SUPERTYPE/ 
TERM TERM DERIVED ATTRIBUTE RELATIONSHIP SUBTYPE 
V 
Derived_ 
using 


图 4-15 ”描述 业务 规则 的 E-R 图 (改编 自 GUIDE Business Rules Project, 1997 ) 


有 三 种 主要 的 业务 规则 类 型 : 导出 、 结 构 断 言 和 动作 断言 。 导 出 (derivation ) 是 指 从 业务 
中 的 其 他 知识 导出 的 语句 。 通 常 ， 导 出 是 包括 文字 和 事实 的 数学 或 逻辑 推论 。 因 为 在 数据 建 模 
中 ， 更 关心 使 用 导出 得 到 的 导出 事实 ， 所 以 ， 在 后 面 章节 中 讨论 导出 事实 时 才 会 间接 地 提 到 导 
出 。 结 构 断 言 (structural assertion) 是 表达 组 织 的 静态 结构 的 某 些 方面 的 语句 。E-R 图 是 说 明 
结构 断言 的 常用 方法 。 正 如 在 图 4-15 中 看 到 的 ， 结 构 断 言 可 以 用 术语 或 事实 (术语 和 事实 曾 在 
第 3 章 中 定义 ) 来 表述 。 术 语 在 事实 的 语句 中 起 作用 。 术 语 可 以 是 普通 的 术语 ， 即 在 通常 情况 
下 可 以 理解 ; 术语 也 可 以 是 业务 术语 ， 即 需要 在 特定 的 上 下 文 下 去 理解 。 动 作 断 言 (action 
assertion ) 是 关于 组 织 动作 的 约束 或 控制 的 语句 。 动 作 断 言 是 一 些 业务 规则 的 性 质 ， 并 说 明了 
在 什么 条 件 下 ， 根 据 什么 样 的 业务 规则 执行 特定 的 动作 ( 记 住 ， 业 务 规则 可 以 只 是 实体 类 型 、 














联系 或 属性 的 定义 )。 例 如 ， 动 作 断 言 能 够 论述 在 什么 条 件 下 ， 可 以 创建 一 个 新 的 顾客 或 填写 
一 个 新 的 购 货 订 单 。 另 一 种 常见 的 动作 断言 类 型 说 明了 特定 的 属性 会 有 什么 样 的 值 (有 时 称 为 
域 约束 )。 

下 面 几 节 论 述 了 结构 断言 的 各 种 形式 ， 它 们 通常 在 E-R 图 或 EER 图 中 说 明 ， 并 出 现在 相关 
数据 库 文档 中 。 因 此 ， 下 面 几 节 将 论述 动作 断言 。 它 们 可 以 实现 为 数据 库 中 的 触发 器 或 存储 过 
程 ， 这 将 在 本 书 的 后 面 讨 论 。 我 们 使 用 简单 的 课程 表 数据 模型 来 说 明 这 些 断 言 。 图 4-16 给 出 了 
该 例子 的 E-R 模 型 。 





Date_Qualified 

















SECTION |E>e 


图 4-16 课程 表 的 数据 模型 片段 


图 4-16 中 的 E-R 模 型 包含 4 个 实体 类 型 : FACULTY、COURSE、SECTION 和 STUDENT， 
并 且 给 出 了 这 些 实体 类 型 之 间 的 联系 。 注 意 ， 因 为 SECTION 不 能 离开 COURSE 实 体 类 型 而 存 
在 ， 所 以 它 是 弱 实 体 类 型 。 将 SECTION 的 标识 联系 为 Is_scheduled， 部 分 标识 符 是 Section_ID 
(复合 属性 )。 为 了 简化 该 图 ， 仅 给 出 了 各 实体 类 型 的 部 分 属性 。 
4.7.2 陈述 结构 断言 
结构 断言 论述 对 组 织 重要 的 一 些 事物 存在 ， 或 存在 于 与 其 他 感 兴趣 的 事物 之 间 的 联系 中 。 
结构 断言 可 以 只 是 术语 的 定义 或 描述 术语 之 间 联 系 的 事实 。 四 个 事实 的 例子 是 : 
“ 课程 是 在 特定 学 科 中 的 一 个 教学 模块 。 术 语 定义 “课程 ”与 两 个 术语 相关 : 教学 模块 和 
学 科 。 假 定 这 是 两 个 常用 术语 ， 不 需要 进一步 在 业务 上 下 文中 定义 。 
* 学生 姓名 是 学 生 的 一 个 属性 。 这 个 事实 在 图 4-16 中 通过 Student_Name 属 性 说 明 。 
“一 个 学 生 可 以 注册 多 个 班 ， 并 且 一 个 班 可 以 被 多 个 学 生 注 册 。 这 个 事实 表明 了 联系 中 实 
体 类 型 的 参与 。 学 生 和 班 都 是 需要 定义 的 业务 术语 。 图 4-16 通 过 Is_registered 联 系 说 明了 
这 个 事实 。 
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“教员 是 大 学 的 员工 。 尽 管 图 4-16 中 设 有 给 出 ， 这 个 事实 指明 了 子 类 型 教员 及 其 超 类 型 员 
工 之 间 的 超 类 型 / 子 类 型 联系 。 

导出 事实 

上 面 所 描述 的 事实 类 型 称 为 基 事实 ， 即 不 能 从 其 他 术语 或 事实 导出 的 基本 的 事实 。 另 一 种 
类 型 的 事实 称 为 导出 事实 (如 图 4-16 所 示 )。 导 出 事实 (derived fact) 是 使 用 算法 或 推理 从 业 
务 规则 中 导出 的 事实 。 可 以 像 对 待 基 事实 那样 对 待 导出 事实 (例如 ， 因 为 导出 事实 是 一 种 业务 
规则 , 那么 动作 断言 可 能 是 导出 事实 的 性 质 )。 第 3 章 定 义 的 导出 属性 就 是 导出 事实 的 一 个 例子 。 
下 面 给 出 了 两 个 导出 事实 的 例子 : 

。 Student_GPA = Quality_Points/Total_Hours_Taken 

其 中 ，Quality_Points=sum[for all courses attempted] 

(Credit_Hours*Numerical_Grade) 

在 这 个 例子 中 ，Student_GPA 是 从 其 他 的 基 事 实 和 导出 事实 中 导出 的 。Quality_Points 和 
Total_Hours 也 是 导出 事实 。Student_GPA 在 图 4-16 中 以 连 向 STUDENT 的 虚线 椭圆 给 
Numerical_Grade 是 Is_registered 的 属性 ，Credit_Hours 是 COURSE 的 属性 。 

“学 生 由 分 配给 学 生 注册 的 班级 的 老师 授课 。 读 者 可 以 看 到 ， 根 据 STUDENT 或 SECTION 

的 联系 Is_registered 以 及 随后 的 SECTION 到 FACULTY 的 联系 Is_assigned， 如 何 导 出 这 个 
事实 。 
4.7.3 陈述 动作 断言 

结构 断言 处 理 的 是 组 织 的 静态 结构 ， 而 动作 断言 处 理 的 是 组 织 的 动态 方面 。 动 作 断 言 将 约 
束 “ 定 (一 定 不 )” 或 “应 该 (不 应 该 )” 强 加 于 要 处 理 的 数据 。 动 作 断 言 是 一 些 业 务 规则 
( 称 为 锚 点 对 象 ) 的 性 质 ; 对 于 数据 处 理 动作 (例如 ， 创 建 、 更 新 、 删 除 、 读 )， 它 描述 了 其 他 
业务 规则 ( 称 为 对 应 对 象 ) 如 何 作用 于 锚 点 对 象 。 动 作 断 言 的 一 些 例子 如 下 : 

* 每 门 课程 ( 锚 点 对 象 ) 必须 有 一 个 课程 名 (对 应 对 象 )。 在 该 例 中 ， 动 作 是 更 新 课程 的 名 

字 性 质 。 
* 每 个 学 生 ( 销 点 对 象 ) 必须 获得 2.0 及 以 上 的 Student_GPA (对 应 对 象 ) 才能 毕业 (动作 )。 
在 该 例 中 ， 锚 点 对 象 是 结构 断言 ， 但 是 ， 锚 点 对 象 也 可 能 是 另 一 个 动作 断言 。 

* 如 果 一 个 班级 没有 分 配 有 资质 的 教师 (对 应 对 象 是 联系 Is_qualified )， 则 学 生 不 能 注册 该 

班级 ( 锚 点 对 象 是 联系 Is_registered ) 。 

动作 断言 的 类 型 

为 了 简单 起 见 ， 图 4-15 没 有 给 出 所 有 类 型 的 动作 断言 。 有 三 种 方式 可 以 为 动作 断言 分 类 : 

1) 可 以 根据 断言 的 结果 来 分 类 动作 断言 。 考 虑 这 种 方式 产生 的 三 种 动作 断言 : 

a. 条 件 如 果 某 事 是 真 的 ， 则 应 用 另 一 个 业务 规则 。 上 面 动 作 断 言 的 第 三 个 例子 可 以 以 
条 件 的 形式 描述 “如 果 一 门 课程 分 配 了 有 资质 的 教师 ， 则 学 生 能 够 注册 开设 该 课程 

b. 完整 性 约束 一些 事情 必须 永远 是 真 的 。 上 面 动作 断言 的 第 一 个 例子 说 明了 完整 性 
约束 。 还 可 以 给 出 另 一 个 例子 : “教师 获得 授课 资质 的 日 期 不 能 在 给 该 教师 分 配 开设 
该 课程 班级 的 那 学 期 之 后 。” 

c. 投 权 ”陈述 了 权限 。 例如， 只 有 系 主任 (一 种 类 型 的 用 户 ) 才能 授权 一 个 教师 教授 
某 门 课程 。 

2) 可 以 根据 断言 的 形式 来 分 类 动作 断言 。 考 虑 这 种 方式 产生 的 三 种 类 型 的 动作 断言 : 

a. 激活 器 (Enabler) 陈述 如 果 为 真 ， 允 许 或 导致 对 应 对 象 的 存在 。 激 活 器 的 一 个 例子 








是 :“ 一 且 一 名 教师 有 资格 教授 至 少 一 门 课 程 ， 就 可 以 创建 该 教师 。 
.定时 器 (Timer) 激活 (禁止 ) 或 创建 (删除 ) 一 个 动作 。 定时 器 断言 的 一 个 例子 
是 : “如 果 一 个 学 生 的 GPA 大 于 2.0， 并 且 总 学 时 数 超过 125 ， 则 该 学 生 可 以 毕业 。” 注 
意 ， 毕 业 这 个 动作 并 不 因为 该 定时 器 断言 而 发 生 ， 但 是 ， 定 时 器 可 以 激活 该 动作 。 
c. 执 行 器 (Executive) 引起 一 个 或 多 个 动作 的 执行 。 可 以 把 一 个 执行 器 动作 断言 当成 
一 些 动 作 的 触发 器 。 执 行 器 动作 断言 的 一 个 例子 :“ 若 一 个 学 生 的 GPA 低 于 2.0， 那 么 
该 学 生 继 续 留 校 学 习 。 ”该 动作 断言 可 能 导致 学 生 的 一 个 状态 属性 更 新 为 值 


b 


“probation” 。 : 
3) 可 以 根据 断言 的 严格 性 来 分 类 动作 断言 。 考 虑 这 种 方式 产生 的 两 种 类 型 的 动作 断言 : 
a. 控制 (controlling) 陈述 了 一 些 一 定 发 生 或 一 定 不 发 生 的 事情 。 本 书 迄 今 为 止 使 用 
的 例子 都 属于 这 一 类 。 
b. 影响 (influencing) 一 些 指导 原则 或 对 一 定 发 生 的 某 个 通知 感 兴趣 的 术语 。 影 响 动 
作 汤 言 的 一 个 例子 是 “ 当 注 册 某 个 班级 的 学 生 数 超过 其 班 容量 的 90% 时 ， 通 知 负责 的 
系 主任 。 在 这 种 情况 下 ， 没 有 控制 任何 事情 (学生 仍然 可 以 继续 注册 接近 班 容量 的 
班级 ， 并 不 需要 创建 另外 的 班级 )， 但 是 ， 管 理 人 员 想 知道 某 个 特定 的 状况 发 生 了 。 
4.7.4 表示 和 强制 业务 规则 执行 
大 多 数组 织 都 有 成 百 上 千 这 样 的 规则 。 传 统 上， 动作 断言 以 混入 单个 应 用 程序 的 过 程 罗 辑 
来 实现 ， 这 种 形式 实际 上 未 被 承认 、 不 可 管理 并 有 不 一 致 性 。 这 种 方法 给 程序 员 带 来 很 大 负担 ， 
程序 员 必 须 清楚 动作 可 能 违反 的 所 有 约束 ， 并 检查 其 中 每 一 个 约束 。 程 序 员 的 任何 玻 忽 、 误 解 
或 错误 都 可 能 使 数据 库 处 于 无 效 的 状态 。 
更 为 现代 的 方法 是 在 概念 层 声 明 动作 断言 ， 而 不 是 说 明 如 何 实现 规则 。 因 此 ， 需 要 描述 业 
务 规 则 的 规格 说 明 语言 。 读 者 已 经 看 到 ，EER 符 号 能 够 用 于 指定 多 种 业务 规则 。 实 际 上 ， 与 更 
简单 的 E-R 符 号 相 比 ，EER 符 号 的 发 明 为 了 使 更 多 业务 规则 能 以 图 形 化 方法 表示 。 除 了 图 形 化 
符号 之 外 ， 另 -种 方法 是 结构 化 语法 〈 诸 如 英语 的 某 种 受 限 形式 )。 不 论 是 图 形 化 形式 还 是 语 
法 形式 ， 业 务 规则 语言 规格 说 明 需 要 具备 两 种 良好 特性 : 
1) 应 该 相对 简单 ， 以 便 最 终 用 户 不 仅 能 够 理解 规则 语句 ， 而 且 能 够 自己 定义 规则 。 
2) 说 明 语 言 应 该 足够 结构 化 ， 从 而 能 够 自动 转换 为 遵守 规范 的 计算 机 代码 。 
下 面 一 节 论 述 指定 业务 规则 的 图 形 化 和 结构 化 语法 方法 。 本 书 使 用 的 图 形 化 方法 来 自 Ross 
(1997) 的 著作 ， 他 是 开发 业务 规则 规格 说 明 的 一 个 先驱 。 
业务 规则 样 例 
本 节 用 两 个 新 的 业务 规则 补充 图 4-16 所 示 的 课程 表 数据 模型 。 在 本 章 后 面 的 问题 与 练习 中 ， 
会 让 读者 加 入 另外 的 规则 。 
业务 规则 1 对 于 分 配 教 某 个 班级 的 一 个 教师 ， 一 定 要 获得 教授 该 班级 课程 的 授课 资格 。 
该 规则 涉及 图 4-16 中 的 三 个 实体 类 型 : FACULTY、 SECTION 以 及 COURSE。 问 题 是 : 是 
否 能 够 分 配 一 个 教师 教授 某 个 班级 。 因 此 ， 锚 点 对 象 是 联系 Is_assigned。 在 这 里 ， 没有 约束 教 
师 ， 也 没有 约束 班级 。 约 束 的 是 教师 到 班级 的 分 派 。 图 4-17 显 示 了 从 [s_assigned 到 动作 断言 符 
号 的 虚线 。 
什么 是 这 个 规则 中 的 对 应 对 象 ? 对 于 分 配 教授 某 个 班级 的 教师 ， 有 两 个 必要 条 件 : 
]) 教师 必须 有 资格 教授 课程 (该 信息 由 联系 Is_qualified 记 录 )。 
2) 必须 安排 该 课程 的 班级 (该 信息 由 联系 Is_scheduled 记 录 )。 
因此 ， 在 这 种 情况 下 ， 有 两 个 对 应 对 象 。 该 事实 由 从 动作 断言 符号 到 两 个 联系 的 虚线 
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业务 规则 2 对 分 配 教 某 个 班级 的 一 个 教师 ， 该 教师 教授 班级 的 总 数 不 能 超过 二 个 。 

该 规则 在 某 时 刻 教师 教授 班级 的 总 数 上 强加 了 一 个 限制 。 由 于 规则 涉及 总 数 ， 因 此 需要 修 
改 前 面 的 符号 

如 图 4-18 所 示 ， 锚 点 对 象 又 是 联系 Is_assigned。 但 是 ， 这 种 情况 下 ， 对 应 对 象 也 是 联系 
Is_assigned。 尤 其 是 ， 它 是 分 配给 教师 的 班级 的 计数 。 动 作 断 言 符 号 中 的 字母 “LIM” 表 示 
“限制 *"。 从 该 符号 指向 带 有 字母 “U” 的 圆 的 箭头 ， 字母“U” 表 示 “ 上 限 ”。 第 二 个 加 包含 数 
字 3， 表 示 上 限 为 3。 因 此 ， 约 束 可 读 作 : “对 应 对 象 是 分 配给 教师 的 班级 数 ， 其 上 限 是 3。” 如 
采 已 经 给 某 教 师 分 配 了 三 个 班级 ， 那 么 将 会 拒绝 任何 试图 给 该 教师 增加 班级 的 事务 。 

可 以 使 用 SQL 语言 实现 上 述 这 些 业 务 规则 ， 并 且 将 规则 存储 为 数据 库 定 义 的 一 部 分 。 使 用 
SQL 实现 规则 的 一 种 方法 是 使 用 CREATE ASSERTION 语 句 ， 它 包含 在 SQL 语言 的 最 新 版 本 中 
(SQL2)。 例 如 ， 对 于 业务 规则 2， 下 面 语 句 创建 了 名 为 “Overload_Protect” 的 断言 : 

CREATE ASSERTION Overjload Protect 

CHECK (SELECT COUNT(*) 

FROM ASSIGNED 

WHERE Faculty ID = '12345') <= 3} 


该 语句 检查 分 配给 特定 教师 的 班级 总 数 是 否 少 于 或 等 于 相应 的 限制 (3)。 数 据 库 管理 系统 
负责 人 确保 不 会 违反 该 约束 。 
除了 本 节 的 几 个 例子 外 ， 还 可 能 有 很 多 其 他 的 业务 规则 。 参 见 Ross(1997)， 它 提供 了 全 面 


的 列表 和 相关 的 符号 。 


Student ID 
< FACULTY >© ls_qualified Date_Qualified 
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STUDENT COURSE 
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ls_registered © SECTION |[>e-<ls scheduled 


Ce Section_ID 


图 4-17 业务 规则 1: 对 于 分 配 教授 某 个 班级 的 -- 个 教师 ， 一 定 要 获得 教授 读 班 级 课程 
的 授课 资格 (符号 中 的 字母 “R” 表 示 “Restricted”， 它 是 很 多 可 选 约束 中 的 一 个 ) 











Date_Qualified 













Section_ID 











Semester 


图 4-18 业务 规则 2: 对 分 配 教 授 某 个 班级 的 -- 个 教师 ， 该 教师 教授 班级 的 总 数 不 能 超过 三 个 


4.7.5 标识 和 测试 业务 规则 

本 章 已 经 论述 了 各 种 业务 规则 以 及 使 用 结构 化 语法 、EER 图 及 其 扩展 表示 业务 规则 的 方法 。 
数据 分 析 人 员 的 任务 就 是 文档 化 业务 规则 的 规格 说 明 并 确保 尽 可 能 使 用 数据 库 技术 强制 执行 这 
些 业务 规则 。 但 是 ， 在 说 明 业 务 规则 之 前 ， 必 须 标 识 它们 。 一 旦 指定 了 业务 规则 ， 应 该 在 实现 
之 前 测试 它们 。 

标识 和 测试 业务 规则 的 一 个 方法 是 场景 (Moriarty,1993)。 场 景 是 描述 业务 在 给 定 情况 
下 如 何 作出 反应 的 故事 或 剧本 。 场 景 类 似 于 用 例 的 概念 ， 用 例 是 对 象 建 模 的 一 个 重要 工具 
( 见 第 14 章 和 第 15 章 )。 例 如 ， 图 4-16 中 E-R 图 的 场景 主要 关注 和 学 生 相关 的 事件 ， 包 括 被 录 
取 、 注 册 (或 取消 ) 课程 、 获 得 成 绩 和 毕业 。 场 景 通过 追踪 这 些 事件 来 表现 一 个 人 的 状态 。 
场景 用 来 标识 数据 模型 的 元 素 ( 业务 规则 )， 或 测试 处 理 这 些 事件 的 所 有 可 能 情况 的 数据 模 
型 《例如 ， 一 个 学 生 试图 注册 不 存在 的 班级 ， 一 个 试 读 期 学 生 试图 注册 ， 或 一 个 研究 生 试图 
注册 )。 

一 个 学 生 场景 可 能 如 下 : “Missi Davies 登录 课程 注册 系统 以 注册 下 学 期 的 课程 。Missi 输 
入 其 学 生 ID 和 口令 以 获得 选择 课程 的 权限 。Missi 是 MIS 专 业 的 学 生 ，Missi 想 确保 她 已 进入 本 
专业 所 需 的 课程 ， 她 在 MIS 课 程 列表 中 查找 数据 库 课程 。Missi 发 现 ， 下 学 期 有 两 个 班 设置 该 课 
程 ， 一 个 已 经 停止 选课 。 因 此 ， 利 用 这 个 在 线 注册 系统 ，Missi 必 须 选 择 尚未 停止 选课 的 班级 .” 
如 果 还 没有 标识 业务 规则 ， 该 场景 和 其 他 场景 可 以 用 于 标识 数据 模型 应 该 包括 的 术语 、 事 实 和 
动作 断言 。 如 果 一 些 业务 规则 已 经 存在 ， 那 么 场景 中 的 语句 可 以 用 于 验证 处 理 所 有 可 能 情况 的 
业务 规则 。 
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本 章 论 述 了 如 何 扩展 基本 的 E-R 模 型 ， 使 之 包括 超 类 型 / 子 类 型 联系 。 超 类 型 是 与 一 个 或 多 
个 子 类 型 有 联系 的 一 般 实体 类 型 。 子 类 型 是 对 组 织 有 意义 的 一 个 实体 类 型 中 的 一 组 实体 ,。 例如， 
实体 类 型 PERSON 通 常 建 模 为 超 类 型 ， 其 子 类 型 可 能 包括 EMPLOYEE、VOLUNTEER 和 
CLIENT。 子 类 型 继承 其 超 类 型 的 属性 和 联系 。 

在 数据 建 模 中 ， 当 下 面 两 个 条 件 之 一 (或 全 部 ) 成 立时 ， 通 常会 考虑 超 类 型 / 子 类 型 联系 。 
首先 ， 存 在 一 些 属性 适用 于 一 个 实体 类 型 的 一 些 (不 是 全 部 ) 实例 ; 其 次 ， 一 个 子 类 型 的 实例 
参与 那个 子 类 型 特有 的 联系 。 

概 化 和 特 化 技术 是 开发 超 类 型 / 子 类 型 联系 的 重要 方法 。 概 化 是 自 底 向 上 的 过 程 ， 从 一 些 
特定 的 实体 类 型 定义 概括 的 实体 类 型 。 特 化 是 自 顶 向 下 的 过 程 ， 为 已 定义 的 超 类 型 定义 一 个 或 
多 个 子 类 型 。 

使 用 EER 符 号 能 够 捕获 适用 于 超 类 型 / 子 类 型 联系 的 重要 的 业务 规则 。 使 用 完备 性 约束 能 够 
说 明 一 个 超 类 型 的 实例 是 否 必 须 是 至 少 一 个 子 类 型 的 实例 。 有 两 种 情况 : 对 于 完全 特 化 规则 ， 
超 类 型 的 一 个 实例 必须 是 至 少 一 个 子 类 型 的 实例 。 对 于 部 分 特 化 规则 ， 超 类 型 的 一 个 实例 可 能 
是 (也 可 能 不 是 ) 任何 子 类 型 的 实例 。 使 用 不 相交 约束 能 够 说 明 一 个 超 类 型 的 实例 是 否 可 能 同 
时 是 两 个 或 多 个 子 类 型 的 实例 。 同 样 ， 有 两 种 情况 : 对 于 不 相交 规则 ， 在 给 定 的 时 间 ， 一 个 实 
例 ( 超 类 型 的 实例 ) 只 能 是 一 个 子 类 型 的 实例 ; 对 于 交 愉 规则， 一 个 实体 实例 可 以 同时 是 两 个 
(或 多 个 ) 子 类 型 的 实例 。 

子 类 型 鉴别 符 是 超 类 型 的 属性 ， 其 值 决定 了 超 类 型 的 实例 属于 哪 一 个 (或 多 个 ) 子 类 型 。 
超 类 型 / 子 类 型 层次 是 超 类 型 和 子 类 型 的 层次 安排 ， 其 中 每 一 个 子 类 型 仅 有 一 个 超 类 型 。 

除了 超 类 型 / 子 类 型 联系 外 ，E-R 符 号 还 有 其 他 的 扩充 。 其 中 一 个 较 有 用 的 扩充 是 聚合 ， 聚 
合 表示 一 些 实体 是 另 一 些 实体 的 一 部 分 〈 例 如 ， 计 算 机 是 由 磁盘 驱动 器 、RAM、 主 板 等 组 成 )。 
由 于 篇 幅 的 限制 ， 在 本 章 没 有 讨论 这 些 扩展 。 这 些 扩展 中 的 大 多 数 ， 如 聚合 ， 也 是 面向 对 象 数 
据 建 模 的 一 部 分 ， 这 部 分 内 容 将 在 第 14 章 或 第 15 章 讨论 。 

E-R 图 可 能 会 包含 数 百 个 实体 ， 因 而 变 得 庞大 而 且 复 杂 。 很 多 用 户 和 经 理 为 了 理解 数据 库 
中 他 们 最 感 兴趣 的 那 一 部 分 ， 不 必 看 到 所 有 的 实体 、 联 系 和 属性 。 实 体 聚 入 是 解决 该 问题 的 一 
种 方法 ， 它 将 一 部 分 实体 -联系 数据 模型 转换 成 相同 数据 的 宏观 视图 。 实 体 聚 镰 将 一 个 或 多 个 
实体 类 型 及 相关 联系 的 集合 组 成 单个 的 抽象 实体 类 型 。 儿 个 实体 聚焦 及 相关 联系 可 以 进一步 组 
成 更 高 层 的 实体 聚 往 ， 因 此 ， 实 体 聚 焦 是 一 种 层次 分 解 技术 。 通 过 将 实体 和 联系 分 组 ， 可 以 对 
E-R 图 进行 合理 布局 ， 使 人 们 关注 数据 建 模 任务 中 最 要 紧 的 那 部 分 模型 的 细节 ，。 

业务 规则 是 定义 或 约束 业务 的 某 些 方面 的 语句 。 其 目的 是 声明 业务 结构 ， 或 控制 、 影 响 商 
业 行为 。 可 以 将 规则 分 为 三 类 : 导出 、 结 构 断 言 和 动作 断言 。 结 构 断 言 定义 组 织 的 静态 结构 ， 
而 动作 断言 是 约束 组 织 的 动态 操作 的 规则 。 结 构 断 言 是 术语 或 事实 。 术 语 是 关于 业务 规则 概念 
的 定义 ， 事实 是 涉及 两 个 或 多 个 术语 的 关联 的 语句 。 事 实 可 以 是 基本 的 或 基础 的 事实 ， 也 可 以 
是 从 其 他 事实 的 数学 或 逻辑 操作 中 导出 的 事实 。 它 们 可 以 处 理 属 性 、 联 系 或 事实 之 间 的 超 类 型 / 
子 类 型 联系 。 

动作 断言 论述 了 一 些 业 务 规则 之 上 的 动作 (如 创建 、 删 除 、 更 新 和 读 )， 这 些 业务 规则 称 
为 错 点 对 象 ， 被 其 他 对 应 对 象 所 约束 。 约 束 可 以 是 “If-Then-Else” 条 件 、 完 整 性 规则 或 授权 
权限 。 动 作 断 言 允 许 对 应 对 象 的 存在 、 激 活 或 禁止 菜 个 动作 或 引起 动作 的 执行 。 其 他 类 型 的 动 
作 断 言 包 括 特定 条 件 下 触发 器 通知 的 简单 指导 方针 。 








关键 术语 

动作 

属性 继承 

导出 

不 相交 约束 

概 化 

特 化 

子 类 型 鉴别 符 

完全 特 化 规则 
复习 问题 
.定义 下 列 术 语 。 
a. 超 类 型 
c. 特 化 
e. 结构 断言 
g. 子 类 型 鉴别 符 
i. 概 化 
k. 交合 规则 


一 


[ed 


_ 子 类 型 
_ ”实体 聚 和 化 
结构 断言 
__ 子 类 型 
_ 特 化 

_ _ _ 销 点 对 象 
动作 
~ 子 类 型 鉴别 符 
_ ”属性 继承 
_ ”交合 规 则 
一 对 应 对 象 
导出 事实 








问题 和 练习 


1. 检查 大 学 EER 图 的 层次 (参见 图 4-10)。 


动作 断言 

完备 性 约束 

导出 事实 

增强 型 实体 联系 (EER) 模 型 
交 司 规则 

结构 断言 

超 类 型 


b. 子 类 型 

d. 实体 聚 簇 

f. 销 点 对 象 

h. 完全 特 化 规则 
j. 不 相交 规则 
1 动作 断言 
.将 下 列 术语 与 其 定义 匹配 起 来 。 


a. 子 类 型 的 集合 

b. 属于 两 个 子 类 型 的 实体 
c. 子 类 型 获得 超 类 型 属性 
4. 关于 限制 哪个 动作 的 规则 
e. 影响 动作 的 业务 规则 

f. 创建 、 删 除 、 更 新 或 读 

g. 使 用 算法 计算 

h. 概括 的 实体 类 型 

i. 组织 的 静态 结构 


j. 创建 一 个 实体 类 型 的 子 类 型 
k. 一 组 相关 的 实体 类 型 和 联系 
1. 查找 一 个 实体 类 型 的 目标 子 类 型 


锁 点 对 象 

对 应 对 象 

不 相交 规则 - 

实体 聚 禾 

部 分 特 化 规则 

子 类 型 

超 类 型 / 子 类 型 层次 


作为 学 生 ， 你 是 下 列子 类 型 的 实例 : 


UNDERGRAD STUDENT 或 GRADUATE STUDENT。 列 出 适合 你 的 所 有 属性 的 名 字 ， 然 后 ， 


对 每 一 个 属性 ， 给 出 适合 的 数据 值 。 


2. 为 图 4-10 中 的 每 一 个 超 类 型 添加 一 个 子 类 型 鉴别 符 。 给 出 指定 实例 给 不 同 子 类 型 的 鉴别 
符 的 值 。 使 用 下 面 的 子 类 型 鉴别 符 和 值 : 
a. PERSON: Person_Type(Employee?, Alumnus?, Student?) 
b. EMPLOYEE: Employee_Type(Faculty, Staff) 
c¢. STUDENT: Student_Type(Grad, Undergrad) 
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3. 为 下 面 的 问题 绘制 一 个 EER 图 。 

一 个 非 一 利 组 织 的 成 功 运作 ， 依 赖 于 不 同类 型 的 人 员 。 该 组 织 对 所 有 人 员 的 下 列 属性 感 兴 
趣 : SSN、Name、Address、City/State/Zip 和 Telephone。 他 们 对 三 种 类 型 的 人 员 最 感 兴趣 : 员 
工 、 志 愿 者 和 捐赠 者 。 员 工 仅 有 Date_Nired 属 性 ; 志愿 者 仅 有 Skill 属性 ; 捐赠 者 仅 有 与 tem 实 
体 类 型 之 间 的 联系 ( 称 为 Donates )。 捐 赠 者 必须 已 捐赠 一 到 多 项 ， 而 某 一 项 可 以 设 有 捐赠 者 ， 
也 可 以 有 一 个 或 多 个 捐赠 者 。 

除了 上 述 几 种 组 织 感 兴趣 的 人 员外 ， 还 有 其 他 一 些 人 员 。 央 此 ， 一 个 人 可 能 不 属于 这 三 种 

类 型 的 任何 一 种 。 另 一 方面 ， 一 个 人 可 能 同时 属于 其 中 两 个 或 多 个 类 型 (例如 ， 员 工 和 捐赠 
者 )。 
4. 在 问题 和 练习 3 创建 的 E-R 图 中 ， 加 入 一 个 子 类 型 鉴别 符 ( 称 为 Person_type)。 
5. 汽车 租赁 机 构 将 它 所 租赁 的 交通 工具 分 为 四 类 : 小 型 、 中 型 、 大 型 及 运动 型 。 机 构想 要 
记录 交通 工具 的 下 列 数据 : Vehicle_ ID、Make、Model、Year 和 Color。 这 四 类 交通 工具 都 没有 
独特 的 属性 。 实 体 类 型 Vehicle 与 实体 类 型 Customer 有 一 种 联系 ( 称 为 Rent)。 四 种 交通 工具 与 
另外 的 实体 类 型 都 没有 专门 的 联系 。 你 是 否 苦 虑 要 为 该 问题 创建 一 个 超 类 型 / 子 类 型 联系 ? 为 
什么 ? 

6. 在 -次 周末 度假 中 ， 实 体 类 型 PERSON 有 -: 个 子 类 型 : CAMPER、BIKER 和 RUNNER。 
分 别 为 下 面 每 一 种 情况 画 一 个 EER 图 片段 

a. 在 某 一 给 定时 间 ， 某 一 个 人 必须 仅 属于 其 中 一 种 子 类 型 。 

b. 某 一 个 人 可 能 属于 (或 不 属于 ) 这 些 子 类 型 。 另 一 方面 ， 某 一 个 人 可 能 同时 是 这 些 子 
类 型 中 的 任何 两 个 (其 至 三 个 )。 

c. 在 某 一 给 定时 间 ， 某 一 个 人 必须 至 少 属于 其 中 一 种 子 类 型 。 

7 . 某 一 银行 有 三 种 类 型 的 账户 ， 支票 、 存 款 、 贷 款 。 下 面 是 每 一 种 账户 类 型 的 属性 : 

CHECKING: Acct_No、 Date_Opened、Balance、Service_Charge 

SAVINGS: Acct No、Date_Opened、Balance、 Interest_Rate 

LOAN: Acct No、Date_Opened、Balance、 Interest_Rate、Payment 

假设 每 一 个 银行 账户 必须 仅 属于 其 中 一 种 子 类 型 。 使 用 概 化 给 出 表示 这 种 情况 的 EER 模 型 。 
记 住 使 用 子 类 型 鉴别 符 。 

8. 参考 图 4-2 中 的 员工 EER 图 完成 下 面 的 练习 。 可 以 做 出 你 认为 必要 的 任何 假设 。 

a. 对 图 中 每 个 实体 类 型 、 属 性 和 联系 ， 给 出 示范 性 定义 。 
b. 为 图 中 所 有 属性 ， 给 出 示范 性 的 完整 性 约束 动作 断言 。 
9. 参考 图 4-16 中 的 课程 表 的 数据 模型 完成 下 面 练习 。 在 图 中 加 入 表达 下 列 业务 规则 的 符 


恕 . 
5: 


a. 对 一 个 要 安排 课程 的 班级 ， 必 须 分 配 一 个 有 资格 教授 这 门 的 课程 的 教师 (提示 :， 见 图 
4-17 )。 
b. 对 要 注册 一 个 课程 的 某 个 班级 的 学 生来 说 ， 在 一 给 时 间 内 ， 这 个 学 生 注 册 的 班级 不 能 
多 于 六 个 (提示 : 见 图 4-17 )。 
10. 参考 医院 联系 的 EER 图 ( 见 图 4-3) ， 加 入 表达 下 列 规则 的 符号 : 仅 当 给 某 个 住院 病人 
分 配 一 个 主治 医生 后 ， 才 能 给 这 个 住院 病人 分 配 一 个 床位 。 
在 这 个 例子 中 ， 同 答 下 列 问题 : 
a. 哪个 〈 或 哪些 ) 是 锚 点 对 象 ? 
b. 哪个 (或 哪些 ) 是 对 应 对 象 ? 
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11. 考虑 下 面 的 业务 规则 : “ 仅 当 一 个 学 生 完成 了 他 的 家 庭 作 业 后 ， 他 才能 去 参加 音乐 会 。” 
a. 男 一 个 EER 图 描述 这 条 规则 所 瞳 示 的 实体 和 联系 。 
b. 加 入 合适 的 符号 以 表达 业务 规则 。 
c. 标 识 下 列 对 象 : (1) 锚 点 对 象 ; (2) 对 应 对 象 。 
12. 参考 病人 的 EER 图 ( 见 图 4-3) 完成 下 列 练习 。 可 以 做 出 你 认为 必要 的 任何 假设 。 
4. 对 图 中 每 一 个 实体 类 型 、 属 性 和 联系 给 出 其 定义 。 
b. 对 图 中 的 每 个 属性 ， 给 出 其 完整 性 约束 动作 断言 。 
13. 图 4-13 给 出 了 松 谷 家 具 公司 E-R 图 的 实体 聚 徐 的 开发 过 程 。 参 考 图 4-13b， 回 答 下 面 的 


a. 为 什么 Does_businese_in 联 系 中 CUSTOMER 一 端的 最 小 基数 是 0? 
b. ITEM 的 属性 有 哪些 (参考 图 3-22) ? 
c. MATERIAL 的 属性 应 该 有 哪些 (参考 图 3-22) ? 

14. 参考 第 3 章 问题 与 练习 6 的 答案 。 开 发 该 图 的 实体 聚 簇 ， 并 使 用 实体 聚 繁重 画 该 图 。 解 
释 为 什么 选择 你 所 使 用 的 实体 聚 秘 。 

15. 参考 第 3 章 问 题 与 练习 11 的 答案 。 开 发 该 图 的 实体 聚 往 ， 并 使 用 实体 聚焦 重 画 该 图 。 解 
释 为 什么 选择 你 所 使 用 的 实体 聚 徐 。 

应 用 练习 
1. 与 一 个 朋友 或 家 庭 成 员 面谈 ， 找 到 他 们 可 能 在 工作 中 接触 的 关于 下 列 概 念 常见 的 例子 。 

a. 超 类 型 / 子 类 型 联系 。 向 与 你 面谈 的 人 解释 该 术语 的 含义 。 给 出 一 个 常见 的 例子 ， 如 
PROPERTY: RESIDENTIAL，COMMERCIAL; 或 者 BONDS: CORPORATE， 
MUNICIPAL。 利 用 他 所 提供 的 信息 ， 构 造 一 个 EER 图 并 给 他 审阅 。 如 果 有 必要 ， 由 
你 进行 修正 ， 直 到 你 、 你 的 朋友 或 家 庭 成 员 觉 得 合适 为 止 。 

b. 业务 规则 。 将 本 章 (图 4-17 和 图 4-18) 提供 的 业务 规则 的 例子 ， 解 释 给 与 你 面谈 的 人 。 
当 被 调查 对 象 根据 他 或 她 的 环境 给 出 一 个 业务 规则 时 ， 如 果 需 要 ， 遵 照 本 章 的 语法 进 
行 重 构 。 

2. 访问 本 地 的 两 个 企业 , 一 个 属于 服务 业 ， 另 一 个 属于 制造 业 。 与 这 些 组 织 中 的 员工 面谈 ， 
找 出 一 些 超 类 型 / 子 类 型 联系 和 业务 规则 的 例子 ( 例如,“ 顾客 只 有 任 有 效 的 销售 单 才 能 退货 ” )。 
人 在 什么 样 的 环境 下 才 会 较 容 易 发 现 这 些 构造 ， 为 什么 ? 

3. 请 一 个 当地 公司 的 数据 库 管理 员 或 数据 库 或 系统 分 析 员 向 你 展示 其 组 织 一 个 数据 库 的 
EER 图 (或 E-R 图 )。 这 些 组 织 建 模 了 超 类 型 / 子 类 型 联系 吗 ? 公司 使 用 的 CASE 工 具 支持 这 些 联 
系 吗 ?而且 ， 在 EER 建 模 阶 段 包 括 哪 些 类 型 的 业务 规则 ?如何 表示 业务 规则 ? 在 哪里 存储 ?如 
何 存储 ? 

4. 阅读 GUIDE Business Rules Project(1997) 发 表 的 关 于 业务 规则 的 总 结 以 及 
Gottesdiener(1997) 的 文章 。 在 Web 上 搜索 另外 的 关于 业务 规则 的 文章 。 写 三 页 的 总 结 ， 包 括 业 
务 规则 当前 的 方向 、 对 系统 开发 和 维护 的 潜在 的 影响 。 
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项 目 案例 ; 山 景 社区 医院 


项 目 描述 

山 景 社区 医院 作为 大 型 的 服务 机 构 ,， 大量 人 员 是 其 持续 成 功 的 保障 。 医 院 主 要 依靠 四 类 人 : 
员工 、 医 生 、 病 人 和 志愿 者 。 当 然 ， 所 有 这 些 人 共享 一 些 公共 的 属性 : Person_ID (标识 符 )、 
Name、Address、City/State/Zip、Birth_Date 以 及 Phone 。 

其 中 每 一 类 人 至 少 有 一 个 独特 的 属性 : Employee 有 Date_Hired，Volunteer 有 Skill ， 
Physician 有 Specialty 和 Pager# ( 呼 机 号 ) ，Patients 有 Contact_Date (第 一 次 看 病 的 日 期 )。 

社区 医院 中 也 确实 有 一 些 人 不 属于 上 述 四 类 人 (人 数 相对 较 少 )。 但 是 ， 有 一 些 特殊 的 人 
会 同时 属于 上 述 四 类 中 的 两 类 或 多 类 (例如 ， 病 人 和 志愿 者 )。 

每 一 个 病人 由 且 仅 由 一 名 医生 对 其 负责 。 在 某 个 时 间 ， 有 的 医生 可 能 不 负责 病人 ， 也 可 能 
负责 一 个 或 多 个 病人 。 病 人 分 为 两 类 : 住院 病人 和 门诊 病人 。 每 一 个 住院 病人 都 有 
Date_Admitted 属 性 ; 每 一 个 门诊 病人 都 会 安排 一 次 或 多 次 复诊 。 实 体 visit 有 两 个 属性 : Date 
(部 分 标识 符 ) 和 Comments。 注 意 ， 每 一 个 visit 的 实例 都 不 能 离开 门诊 病人 实体 而 存在 。 

员工 分 为 二 类 : 护士 、 职 员 和 技术 人 员 。 只 有 护士 具有 属性 Certificate ， 意 味 着 资质 (RN， 
LPN 等 ); 仅 有 职员 具有 属性 Job_Class; 只 有 技术 人 员 具 有 属性 Skill。 每 一 个 护士 都 被 分 派 到 
一 个 或 多 个 诊疗 中 心 。 诊 疗 中 心包 括 Maternity、Emergency 和 Cardiology。 诊 疗 中 心 的 属性 有 : 
Name (标识 符 ) 和 Location。 同 时 ， 每 个 诊疗 中 心 都 有 一 名 或 多 名 护士 ， 分 配 到 诊疗 中 心 的 护 
士 都 约定 nurse_in_charge。 如 果 护 士 没有 RN 资质 ， 则 不 能 约定 nurse_in_charge。 

每 一 个 技术 人 员 都 被 分 派 到 一 个 或 多 个 实验 室 。 实 验 室 的 属性 包括 Name (标识 符 ) 和 
Location。 每 一 个 实验 室 至 少 必 须 分 派 一 个 技术 人 员 ， 也 可 以 有 任意 数目 的 技术 人 员 。 

诊疗 中 心 可 能 没有 床位 ， 也 可 能 有 一 个 或 多 个 床位 (可 以 有 任意 数 晶 )。 床 位 的 惟一 属性 
是 Bed_ID (标识 符 )。Bed_ID 是 一 个 复合 属性 ， 它 包括 两 个 部 分 : Bed# 和 Room#。 每 一 个 住院 
病人 必须 分 配 一 个 床位 。 在 某 一 个 时 刻 ， 一 个 床位 可 能 有 也 可 能 没有 被 分 配给 住院 病人 。 

项 目 问 题 

1) 建 模 超 类 型 / 子 类 型 联系 的 能 力 在 出 景 社区 医院 这 样 的 医院 环境 中 是 否 很 重要 ?说 明 你 
的 理由 。 

2) 能 否 将 业务 规则 范 型 和 易于 定义 、 实 现 、 维 护 业 务 规 则 的 能 力作 为 山 景 社区 医院 这 样 的 
医院 环境 的 竞争 优势 ? 说 明 你 的 理由 。 

3) 在 本 项 目 案例 的 数据 需求 描述 中 是 否 有 一 些 弱 实体 ? 如 果 有 ， 列 举 出 这 些 弱 实体 。 

4) 你 能 够 想到 一 些 可 以 用 于 医院 环境 的 业务 规则 吗 ? (本 项 目 案例 中 已 给 出 的 那些 业务 规 
则 除外 。) 

项 目 练习 

有 ) 绘制 一 个 E-R 图 以 准确 地 表示 这 些 需 求 ， 要 利用 本 章 介 绍 的 符号 。 

2) 给 出 项 目 练习 1 的 E-R 图 中 的 下 列 对 象 类 型 的 定义 ， 如 果 有 条 件 的 话 ， 与 医院 或 诊疗 中 
心 的 人 员 讨 论 。 否 则 ， 基 于 你 自己 的 知识 和 经 验 ， 做 出 合理 的 假设 。 

a. 实体 类 型 
b. 属性 
c. 联系 
3) 你 应 当知 道 语 旬 “除非 一 个 护士 有 RN 证 书 ， 否则 他 或 她 不 能 被 指派 为 诊疗 中 心 的 
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nusrse_in_ charge” 是 业务 规则 。 回 答 下 列 问 题 : 
a. 什么 是 锚 点 对 象 ? 它 是 实体 、 属 性 、 联 系 还 是 一 些 其 他 对 象 ? 
b. 什么 是 其 对 应 对 象 (或 对 象 组 ) ? 它 是 实体 、 属 性 、 联 系 或 一 些 其 他 对 象 ? 
4) 将 你 在 本 章 开 发 的 BER 图 与 第 3 章 的 项 目 练习 2 中 开发 的 E-R 图 进行 比较 ， 这 两 张 图 的 区 
别 是 什么 ?它们 为 什么 不 同 ? 
5) 将 项 目 练习 4 和 第 3 章 项 目 练习 2 的 两 个 图 合并 为 一 个 图 ， 解 释 在 合并 过 程 中 你 所 做 的 决 
定 。 





概要 


截止 到 数据 库 开 发 过 程 的 分 析 阶 段 为 止 ， 系 统 和 数据 库 分析 人 员 对 于 数据 库存 储 和 访问 的 
需求 已 经 有 了 相对 清晰 的 了 解 。 但 在 分 析 阶段 里 产生 的 数据 模型 显 式 地 避免 与 数据 库 技术 本 身 
存在 任何 联系 。 在 我 们 可 以 实现 数据 库 以 前 ， 概 念 数据 模型 必须 映射 成 为 一 种 与 所 使 用 的 数据 
库 管理 系统 相 容 的 数据 模型 。 

数据 库 设计 的 目的 是 将 在 数据 库 分 析 阶 段 所 产生 的 对 于 数据 存储 的 需求 转化 为 具体 的 规格 
说 明 ， 以 指导 数据 库 的 实现 。 有 两 种 形式 的 规格 说 明 

1) 逻辑 规格 说 明 ， 将 概念 化 的 需求 映射 为 与 具体 数据 库 管理 系统 相关 的 数据 模型 。 

2) 物理 规格 说 明 ， 确 定 所 有 用 于 实现 的 数据 存储 参数 ， 在 这 个 过 程 中 ， 实 际 的 数据 库 系统 
会 使 用 数据 定义 语言 得 到 定义 。 

在 第 5 章 中， 我 们 将 介绍 逻辑 数据 库 设计 ， 重 点 基于 关系 模式 。 逻 辑 数据 库 设计 是 将 概念 
数据 模型 (第 3 章 和 第 4 章 ) 转化 为 逻辑 数据 模型 的 过 程 。 大 多 数目 前 使 用 的 数据 库 管理 系统 都 
使 用 关系 模式 ， 所 以 我 们 将 它 作 为 讨论 逻辑 数据 库 设计 的 基础 。 

在 本 章 中 ,我们 首先 定义 关系 模式 的 重要 术语 和 概念 ， 包 括 关系 、 主 键 、 外 键 、 异 常 、 范 
式 、 规 范 化 、 函 数 依 赖 、 部 分 函数 依赖 和 传递 依赖 。 然 后 讨论 如 何 将 E-R 模 型 转化 为 关系 模型 。 
虽然 很 多 CASE 工 具 支持 这 种 转化 ， 但 是 理解 基本 的 概念 和 过 程 仍然 非常 重要 。 接 下 来 ,我 们 
详细 介绍 规范 化 (设计 良 构 关系 的 过 程 ) 的 重要 概念 最后， 我 们 讨论 如 何 将 来 自 不 同 源 的 逻 
辑 设计 的 关系 合并 (比如 来 自 同 一 个 项 目 组 的 若干 个 小 组 )， 并 解决 其 中 常见 的 问题 。 

第 6 章 的 主题 是 物理 数据 库 设 计 ， 其 目的 是 将 数据 的 逻辑 描述 转化 为 存 取 数据 的 规格 说 明 。 
主要 目标 是 设计 数据 存储 ， 以 满足 性 能 要 求 ， 同 时 确保 数据 完整 性 、 安 全 性 和 可 恢复 性 。 物 理 
数据 库 设 计 所 制定 的 规格 说 明 ， 会 被 从 事 信息 系统 构建 的 人 员 ， 如 程序 员 等 在 实现 阶段 所 使 用 
(参见 第 7 章 -~ 第 11 章 )。 

在 第 6 章 中 ,读者 会 学 习 到 物理 数据 库 设计 的 主要 术语 和 概念 ， 如 数据 类 型 、 页 、 指 针 、 
非 规范 化 、 分 割 、 索 引文 件 组 织 和 散 列 文件 组 织 等 ， 还 包括 高 效 完成 物理 数据 库 设计 的 基本 步 
蛇 。 读 者 会 了 解 到 存储 属性 值 的 不 同方 法 及 如 何在 这 些 方法 中 进行 选择 ， 同 时 会 明确 为 什么 规 
范 化 的 表 不 一 定 能 组 成 最 好 的 物理 数据 文件 ， 以 及 如 何 通过 非 规范 化 来 改善 数据 存 取 速 度 。 文 
件 组 织 和 索引 对 于 数据 存 取 效率 的 提高 非常 重要 ， 使 用 廉价 磁盘 元 余 阵列 (RAID) 可 以 提供 
更 好 的 数据 库 性 能 和 可 靠 性 ， 该 章 中 会 对 此 进行 介绍 。 此 外 ， 读 者 还 会 学 习 到 不 同 数据 库 系 
统 体系 结构 的 主要 差异 和 一 些 用 于 加 快 数据 访问 速度 的 设计 和 查询 技术 。 

物理 数据 库 设计 必须 是 非常 慎重 的 ， 因 为 在 这 个 阶段 所 作 的 决定 会 对 数据 可 访问 性 、 响 应 
时 间 、 安 全 性 和 用 户 友好 性 等 产生 重要 的 影响 。 物 理 数据 库 设计 和 数据 库 管 理 (第 12 音 ) 密 不 
可 分 ， 在 第 12 章 中 我 们 会 进一步 讨论 一 些 相关 的 问题 ， 第 13 章 会 介绍 分 布 式 数据 库 的 设计 间 
题 。 





第 5 章 逻辑 数据 库 设 计 和 关系 模型 


5.1 学 习 目 标 
学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 
。 掌握 以 下 关键 术语 : 关系 、 主 键 、 复 合 键 、 外 键 、 空 值 、 实 体 完 整 性 规则 、 参 照 完整 性 
约束 、 良 构 关系 、 异 常 、 递 归 外 键 、 规 范 化 、 范 式 、 函 数 依赖 、 决 定 因子 、 候 选 键 、 第 
一 范式 、 第 二 范式 、 部 分 函数 依赖 、 第 三 范式 、 传 递 依赖 、 同 义 词 、 别 名 、 异 义 和 企 业 
键 。 

* 列举 出 关系 的 五 个 性 质 。 

“描述 候选 键 的 两 个 重要 性 质 。 

“用 简洁 的 语言 定义 以 下 概念 : 第 一 范式 、 第 二 范式 和 第 三 范式 。 

* 简要 地 描述 合并 关系 时 可 能 带 来 的 四 个 和 问题。 

“将 E-R 图 〈 或 BER 图 ) 转化 为 逻辑 上 等 价 的 关系 集 。 

* 创建 结合 实体 完整 性 和 参照 完整 性 约束 的 关系 表 。 

“使 用 规范 化 将 含有 异常 的 关系 分 解 为 良 构 关 系 。 


5.2 引言 


在 本 章 中 ， 我 们 将 介绍 逻辑 数据 库 设 计 ， 重 点 介绍 关系 数据 模型 。 逻 辑 数据 库 设 计 是 将 概 
念 数 据 模型 (在 第 3 章 和 第 4 章 中 介绍 过 ) 转化 为 逻辑 数据 模型 的 过 程 。 虽 然 还 存在 着 其 他 的 数 ， 
据 模 型 ， 但 是 由 于 以 下 两 个 原因 ， 我 们 仍 在 本 章 重 点 介绍 关系 数据 模型 。 首 先 ， 在 现代 数据 库 
应 用 中 ， 关 系数 据 模型 使 用 最 广泛 。 其 次 ， 一 些 关 系 模型 的 逻辑 数据 库 设 计 原 理 也 适用 于 其 他 
的 数据 库 模 型 。 

前 面 几 章 通过 一 些 简单 的 例子 已 经 非 正式 地 介绍 过 关系 模型 。 在 本 章 中 ， 我 们 首先 定义 关 
系 模型 的 重要 术语 和 概念 (通常 使 用 缩写 的 术语 关系 模型 来 代表 关系 数据 模型 )， 然 后 介绍 和 
讨论 将 E-R 模 型 转化 为 关系 模型 的 过 程 。 虽 然 现 在 有 很 多 CASE 工 具 可 以 完成 这 一 转化 工作 ， 
但 是 了 解 其 基本 的 原理 和 过 程 仍 然 非常 重要 。 本 章 接着 将 详细 介绍 规范 化 的 概念 。 规 范 化 ( 即 
设计 良 构 关系 的 过 程 ) 是 关系 模型 的 逻辑 设计 的 重要 部 分 。 最 后 ， 本 章 介绍 如 何 合并 关系 ， 以 
避免 这 一 过 程 中 一 些 常见 的 问题 。 

逻辑 数据 库 设 计 的 目标 是 将 概念 设计 (体现 某 个 组 织 对 于 数据 的 需求 ) 转化 为 可 以 在 特定 
的 数据 库 管理 系统 上 实现 的 逻辑 数据 库 。 最 终 的 数据 库 必须 满足 用 户 对 于 数据 共享 、 灵 活性 和 
苑 于 访问 等 方面 的 需求 。 本 章 所 介绍 的 概念 对 于 理解 数据 库 开发 的 过 程 非常 重要 。 


5.3 关系 数据 模型 


关系 数据 模型 最 早 是 由 IBM 公 司 的 E.FCodd 在 1970 提 出 的 (Codd，1970)。 随 即 启动 了 两 个 
早期 的 研究 项 目 来 证 实 关 系 模型 的 可 行 性 以 及 开发 原型 系统 。 其 中 的 第 一 个 项 目 在 IBM 的 San 
TGSe 余 沈 类 验 室 进行 ， 并 于 20 世 纪 70 年 代 后 期 开发 出 System R (一 个 关系 DBMS 一 一 RDBMS 的 
原型 )。 第 二 个 项 目 在 加 利 福 尼 亚 大 学 伯克利 分 校 开 展 ， 开 发 出 一 个 面向 学 术 研 究 的 关系 数据 库 
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管理 系统 Ingres。 大 约 在 1980 年 ， 由 不 同 厂商 提供 的 大 量 商用 关系 数据 库 管理 系统 开始 出 现 (在 
本 书 的 网 站 上 可 以 找到 RDBMS 和 其 他 DBMS 提 供 商 的 链接 )。 现 在 ， 关 系数 据 库 管理 系统 已 成 
为 数据 库 管 理 的 主流 技术 ， 现 在 有 上 百 种 适用 于 从 个 人 计算 机 到 大 型 机 的 关系 数据 库 产品 。 
5.3.1 基本 定义 

关系 数据 模型 采用 表 的 方式 来 存储 数据 。 关 系 模型 以 数学 理论 为 基础 ， 因 而 有 具有 坚实 的 理 
论 基 础 。 但 我 们 只 需要 一 些 简单 的 概念 就 能 描述 关系 模型 ， 即 使 对 于 那些 不 熟悉 基础 理论 的 人 
来 说 ， 也 能 轻松 理解 和 使 用 关系 模型 。 关 系数 据 模型 包含 以 下 三 个 组 成 部 分 (Fleming and von 
Halle,1989 ): 

1) 数据 结构 数据 以 具有 行 和 列 的 表 的 方式 组 织 。 

2) 数据 操纵 ”利用 功能 强大 的 操作 (使 用 SQL 语言 ) 来 操纵 存储 在 关系 中 的 数据 。 

3) 数据 完整 性 在 操纵 数据 时 ， 包 含 相应 的 机 制 来 定义 业务 规则 以 维护 数据 的 完整 性 。 

本 节 主 要 讨论 数据 结构 和 数据 完整 性 ， 数 据 操纵 则 在 第 7 章 、 第 8 章 和 第 10 章 进行 讨论 。 

关系 数据 结构 关系 (relation) 是 一 个 已 命名 的 二 维 数据 表 。 每 个 关系 ( 表 ) 包含 一 组 已 
命名 的 列 ， 以 及 任意 数目 的 未 命名 的 行 。 与 第 3 章 中 的 定义 相同 ， 属 性 是 关系 中 的 一 个 已 命名 
的 列 。 关 系 中 的 每 一 行 对 应 一 条 记录 ， 记 录 中 包含 一 个 实体 的 数据 (属性 ) 值 。 图 5-1 是 一 个 名 
为 EMPLOYEE1 的 关系 。 这 个 关系 包含 以 下 描述 员工 信息 的 属性 : Emp_ID、Name、 
Dept_Name 和 Salary。 表 中 的 五 行 对 应 于 五 个 员 上。 值得 注意 的 是 ， 图 5-1 中 的 示例 数据 是 用 来 
说 明 关 系 EMPLOYEE1 的 结构 的 ; 它们 不 是 关系 本 身 的 一 部 分 。 即 使 我 们 在 图 中 增加 一 行 数据 ， 
它 仍然 是 EMPLOYEE1 关 系 ， 删 除 一 行 也 同样 不 会 改变 这 个 关系 。 实 际 上 ， 即 使 删除 图 5-1 中 的 
所 有 行 ， EMPLOYEE1 关 系 也 仍然 存在 。 换 句 话 说 ， 图 5-1 只 是 EMPLOYEE1 关 系 的 一 个 实例 。 


EMPLOYEEI1 


Pept_Name 


Margaret Simpson Marketing 


Alien Beeton Accounting 


Chris Lucero Info Systems 
Lorenzo Davis Finance 
Susan Martin Marketing 


图 5-1 EMPLOYEE1 关 系 的 示例 数据 


可 以 使 用 下 面 的 简略 表示 方法 来 表示 关系 的 结构 ， 关 系 名 后 面 用 括号 括 起 属性 名 列表 。 
EMPLOYEE1 关 系 可 用 以 下 方法 表示 : 


EMPLOYEE1 (Emp ID，Name， Dept_Name，Salary) 


关系 键 ”用户 必须 能 够 根据 行 中 的 数据 值 来 存储 或 检索 关系 中 的 一 行 数据 。 为 实现 这 个 目 
的 ， 每 个 关系 必须 有 一 个 主键 。 主 键 (primary key) 是 可 以 惟一 标识 关系 中 每 一 行 的 属性 (或 属 
性 集 }。 我 们 通常 在 作为 主键 的 属性 名 加 下 划 线 。 比 如 ， 关 系 EMPLOYEE1 的 主键 是 Emp_ID。 
请 注意 ， 在 图 5-1 中 ， 该 属性 下 加 上 了 下 划 线 。 使 用 简略 表示 方法 ， 我 们 可 以 用 如 下 方式 表示 
该 关系 : 

EMPLOYEE1 (Emp_ID, Name, Dept Name, Salary) 

主键 的 概念 和 第 3 章 中 定义 的 术语 “标识 ”是 相关 的 。 在 E-R 模 型 中 作为 实体 标识 符 的 属性 
(或 属性 集 ) 在 表示 该 实体 的 关系 中 也 可 能 是 主键 的 组 成 部 分 。 但 是 也 有 一 些 例外 :; 比如 关联 
实体 不 一 定 有 标识 ， 弱 实体 的 标识 符 只 是 弱 实 体 主键 的 一 部 分 。 此 外 ， 一 个 实体 中 可 以 作为 关 
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联 关 系 主键 的 属性 可 能 有 多 个 。 在 本 章 的 后 面 ， 我 们 会 讨论 到 这 些 情况 。 

复合 键 (Composite key) 是 由 多 个 属性 构成 的 主键 。 比 如 ， 关 系 DEPENDENT 的 主键 是 由 
Emp_ID 和 Dependent_Name 构 成 的 。 在 本 章 的 后 面 ， 我 们 还 会 再 给 出 一 些 复 合 键 的 例子 。 

我 们 往往 需要 表示 两 个 表 或 关系 之 间 的 联系 ， 这 是 通过 使 用 外 键 来 实现 的 。 外 键 (foreign 
key) 是 一 个 数据 库 中 关系 的 属性 ( 可 能 是 复合 属性 ) ， 它 是 该 数据 库 的 另 一 个 关系 的 主键 。 比 
如 ， 考 虑 关系 EMPLOYEE1 和 DEPARTMENT: 


了 MPLOYEE1(EmPp_ID，Name，Dept_Name，Salary) 
DEPARTMENT (Dept Name. Location, Fax) 


属性 Dept_Name 就 是 关系 EMPLOYEE1 的 外 键 。 它 使 用 户 可 以 将 某 个 员工 与 其 所 属 的 部 门 
关联 起 来 。 为 说 明 一 个 属性 是 外 键 ， 某 些 作者 会 使 用 虚线 下 划 线 来 表示 ， 例 如 


EMPLOYEE] (Emp_ID, Name, Dept Name, Salary) 








在 本 章 的 后 面 ， 我 们 会 介绍 很 多 有 关外 键 的 例子 ， 并 结合 参照 完整 性 来 讨论 外 键 的 性 质 。 

关系 的 性 质 ”在 前 面 我 们 已 经 定义 关系 是 二 维 的 数据 表 ， 但 并 不 是 所 有 的 表 都 是 关系 。 关 
系 具 有 一 些 非 关系 表 所 不 具有 的 性 质 。 我 们 将 这 些 性 质 归纳 如 下 。 

1) 数据 库 内 的 每 个 关系 ( 表 ) 的 名 字 是 惟一 的 。 

2) 任意 行 的 任 一 列 值 是 原子 的 ( 单 值 )。 在 关系 内 ， 不 允许 有 多 值 属 性 。 

3) 每 一 行 是 惟一 的 ， 同 一 关系 内 的 任意 两 行 都 不 能 相同 。 

4) 表 中 的 每 个 属性 ( 列 ) 的 名 字 是 惟一 的 。 

5) 关系 中 列 的 顺序 (从 左 到 右 ) 是 无 关 的 。 交 换 关系 的 任意 两 列 不 影响 关系 的 音义 和 使 用 。 

6) 关系 中 行 的 顺序 (从 上 到 下 ) 是 无 关 的 。 和 列 的 情况 一 样 ， 关 系 中 的 行 也 可 以 交换 或 是 
以 任意 顺序 存储 。 

从 表 中 去 除 多 值 属性 ”关系 的 第 二 项 性 质 规定 关系 中 不 能 有 多 值 属 性 。 因 此 含有 一 个 或 多 
个 多 值 属性 的 表 就 不 是 关系 。 比 如 ， 图 5-2a 扩 展 了 关系 EMPLOYEE1， 以 包含 每 个 员工 所 参加 
的 课程 信息 。 由 于 每 个 员工 所 参加 的 课程 不 一 定 惟一 ， 所 以 属性 Course_Title 和 Data_ 
Completed 都 是 多 值 属 性 。 例 如 ，Emp_ID 为 100 的 员工 参加 两 门 课程 的 学 习 。 如 果 某 个 员工 没 
有 参加 任何 课程 ， 那 么 他 的 Course_Title 和 Data_Completed 属 性 就 为 空 值 ( 例如 Emp_ID 为 190 
的 员工 )。 

在 图 5-2b 中 ， 我 们 通过 将 相应 的 数据 填 人 5-2a 中 空白 的 单元 来 去 除 多 值 属性 ， 现 在 图 5-2b 
中 的 表 只 有 单 值 属 性 ， 并 满足 关系 的 原子 性 质 要 求 。 我 们 将 新 的 关系 命名 为 EMPLOYEE2， 以 
便 与 EMPLOYEE1 区 别 开 来 。 但 是 在 后 面 的 讨论 中 我 们 会 发 现 ， 这 个 新 的 EMPLOYEE2 关 系 有 
一 些 不 好 的 性 质 。 
5.3.2 数据 库 示 例 

一 个 关系 数据 库 中 可 以 包含 任意 多 个 关系 。 数 据 库 的 结构 是 通过 概念 模式 〈 第 2 章 介绍 过 ) 
进行 描述 的 ， 这 是 对 数据 库 的 总 体 逻辑 结构 的 描述 。 有 两 种 常用 的 表示 (概念) 模式 的 方法 : 

1) 短文 本 语句 ， 其 中 关系 名 后 跟着 以 括号 括 起 的 属性 名 (如 本 章 前 面 定义 的 关系 
EMPLOYEE1 和 DEPARTMENT )。 

2) 图 形 表示 ， 其 中 每 个 关系 用 包含 关系 属性 的 矩形 来 表示 。 

文本 语句 的 方法 比较 简单 ， 但 是 图 形 表示 方法 可 以 更 好 地 表示 参照 完整 性 约束 (很 快 就 可 
以 看 到 )。 在 本 节 中 ， 我 们 同时 使 用 这 两 种 方法 来 表示 模式 以 便 进行 比较 。 

在 第 3 章 中 ， 我 们 已 经 为 松 谷 家 具 公司 构建 了 E-R 图 (参见 图 3-22)。 在 第 1 章 中 ， 我 们 给 出 
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了 这 个 数据 库 的 四 个 关系 (参见 图 1-4): CUSTOMER、ORDER、ORDER LINE 和 PRODUCT。 
在 本 节 中 我 们 给 出 这 四 个 关系 的 模式 ， 它 们 的 图 形 表示 见 图 5-3。 

















Dept_Name Course_Title Date_Completed 
Margaret Simpson Marketing 6/19/200X 
10/7/200X 
Alan Beeton Accounting 12/8/200X 
Chris Lucero Info Systems 1/12/200X 
4/22/200X 
torenzo Davis Finance 
Susan Martin Marketing 6/16/200X 
8/12/200X 
a) 含有 重复 组 的 表 
EMPLOYEE2 
Course_Title Date_Completed 
100 Margaret Simpson Marketing 48 000 SPSS 6/19/200X 
100 Margaret Simpson Marketing 48 000 Surveys 10/7/200X 
140 Alan Beeton Accounting 52 000 Tax Acc 12/8/200X 
110 Chris Lucero Info Systems 43 000 SPSS 1/12/200X 
110 Chris Lucero info Systems 43 000 C++ 4/22/200X 
190 Lorenzo Davis Finance 55 000 
150 Susan Martin Marketing 42 000 SPSS 6/19/200X 
150 Susan Martin Marketing 42 000 Java 8/12/200X 
b) EMPLOYEE2 关 系 


图 5-2 消除 多 值 属 性 








CUSTOMER 
Customer_Name Address | City zip 
ORDER 

Order_ID Customer_ID 

ORDER LINE 

prim | aa 

PRODUCT 





Product_ID Product_Description 


注 ; "在 图 3-22 的 基础 上 进行 了 莘 化 。 





Product_Finish | Standard_Price 


图 5-3 松 谷 家 具 公 司 中 四 个 关系 的 模式 
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下 面 是 这 些 关系 的 文本 形式 的 表示 : 

CUSTOMER(Customer ID, Customer_ Name, Address, City, State, Zip) 

ORDER(Order ID, Order_Date, Customer_ID) 

ORDERLINE(Order ID, Product ID, Quantity) 

PRODUCT(Product ID, Product_Description, Product_Finish, Standard_Price, On_Hand) 

注意 ，ORDER_LINE 的 主键 是 复合 键 ， 由 属性 Order_ID 和 Product_ID 构 成 。 另 外 ， 
Customer_ID 是 ORDER 关系 中 的 外 键 ， 这 样 用 户 可 以 将 订单 和 提交 该 订单 的 顾客 联系 起 来 。 
ORDER LINE 有 两 个 外 键 : Order_ ID 和 Product_ID 。 这 两 个 外 键 可 以 使 用 户 将 一 个 订单 中 的 每 
一 行 信 息 和 相关 的 订单 及 产品 联系 起 来 。 

图 5-4 所 示 是 这 个 数据 库 的 一 个 实例 ， 图 中 所 示 的 四 个 表 中 都 有 示例 数据 。 请 注意 外 键 是 
如 何 帮 助 我 们 将 不 同 的 表 相 互 关联 在 一 起 的 。 为 关系 模型 创建 含有 示例 数据 的 实例 有 以 下 三 个 
好 处 : 

1) 示例 数据 提供 一 种 便利 的 检查 设计 准确 性 的 方法 。 

2) 示例 数据 有 利于 和 用 户 讨论 设计 。 

3) 可 以 使 用 示例 数据 开发 原型 应 用 ， 并 测试 查询 。 


Mi 


hi 


1 Contemporsry Casyals 1355 S Hines Blvd Gainesdlle 
2 Yalue Furniture SS SW 7th St Plano 

3 Homs Furrmshings 1900 Alland Aug 和 

4 Eastem Fumiture 1925 Beltlins Rg 

5 jmpsessioss SH85 Westcott Ct 

5 Fumidire Saflery 325 Flatiron Or 


ND 


i pd ci 
1 End Tabie 
2 Cole Table Bch 
3 Computer Desk OQak 
4 Enierairment Center Mapie 
5 Writers Desk Ok 
& 8-Oraver Oresser Breh 
7 48" Bookcass Wainut 
8 和” Bookcase Oak 
9 和 Bookcase Wainut 
名 W" Bookcass Oak 
14 4 Drawer Dresser Oak 
12 8-Drawer Drassar Oak 
13 Nghtstand Chery 
14 Wnters Dask Birch 


0 人 


总 人 





图 $-4 关系 模式 的 实例 


5.4 完整 性 约束 
关系 数据 模型 包含 有 多 种 类 型 的 约束 (业务 规则 ) ， 它 们 用 于 维护 数据 库 内 数据 的 正确 性 
和 完整 性 。 最 主要 的 几 种 完整 性 约束 包括 域 约束 、 实 体 完整 性 、 参 照 完整 性 和 动作 断言 。 


5.4.1 域 约束 
关系 中 某 一 列 的 所 有 值 都 必须 来 源 于 同一 个 域 。 域 是 值 的 集合 , 这些 值 可 以 赋 给 一 个 属性 。 
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一 个 域 定义 通常 包含 以 下 部 分 : 域名 、 含 义 、 数 据 类 型 、 大 小 (或 长 度 )、 人 允许 的 取 值 或 允许 
的 范围 (如 果 适 用 的 话 )。 表 5-1 显 示 了 与 图 5-3 里 属性 相关 的 域 的 定义 。 
表 5-1 选 定 的 属性 的 域 定义 








必 性 域 名 描 述 域 
Customer_ID Customer_IDs 所 有 可 能 的 顾 洛 ID 字符 :大 小 为 5 
Customer_Name Customer_Names 所 有 可 能 的 顾客 名 字符 : 大 小 为 25 
Customer_Address Customer_Addresses 所 有 吕 能 的 顾客 地 址 字符 :大 小 为 30 
Customer_City Cities 所 有 可 能 的 城市 字符 大 小 为 20 
Customer_State States 所 有 可 能 的 州 字符 : 大 小 为 2 
Customer_Zip Zips 所 有 可 能 的 邮编 人 字符: 大 小 为 10 
Order_ID Order_IDs 所 有 可 能 的 订单 ID 字符 : 大 小 为 5 
Order_Date Order_Dates 所 有 可 能 的 订单 是 期 日 期 格式 mm-dd-yy 
Product_ID Product_IDs 所 有 可 能 的 产品 ID 字符 : 大 小 为 5 
Product_Description Product_Descriptions 所 有 可 能 的 产品 描述 他 竹 : 大 小 为 25 
Product_Finish Product_Finishes 产品 可 能 用 的 木材 字符 : 大 小 为 12 
Standard_Price Unit_Prices 所 有 可 能 的 单价 货币 值 : 6 位 数字 
On_Hand On_Hands 所 有 可 能 的 现 有 产品 整数 : 3 位 数字 

5.4.2 实体 完整 性 


实体 完整 性 规则 用 来 确保 每 个 关系 都 有 一 个 主键 ,而 且 主 键 的 所 有 数据 值 都 是 有 效 的 。 特 
别 是 ， 它 能 保证 每 个 主键 的 属性 值 都 非 空 。 

， 在 某 些 情况 下 ， 没 有 办 法 为 某 个 属性 赋值 。 在 以 下 两 种 情况 中 通常 会 出 现 这 种 情形 : 或 者 
是 没有 可 应 用 的 数据 值 ， 或 者 是 在 赋值 时 还 不 知道 数据 值 。 例 如 ， 要 求 员 工 填写 一 张 含 有 传真 
号 码 的 登记 表 。 如 果 该 员工 没有 传真 号 ， 则 只 能 不 填 ， 因 为 不 适用 于 他 。 又 比如 ， 要 求 该 员工 
填写 前 任 雇 主 的 电话 号 码 ， 如 果 他 不 记得 这 个 号 码 ， 则 也 只 能 不 填 ， 因为 这 个 信息 不 知道 。 

利用 关系 数据 模型 ， 我 们 在 碰 到 上 述 情况 时 可 以 为 属性 赋 空 值 。 空 值 (null) 是 一 个 当 没 
有 其 他 值 可 用 ， 或 是 可 用 值 未 知 时 ， 可 以 赋 给 属性 的 值 。 实 际 上 ， null 不 是 一 个 值 ， 而 是 表示 
值 的 空缺 。 例 如 ，null 和 数字 0 或 是 空 串 都 不 相同 。 在 关系 模型 中 引入 null 存 在 着 争议 ， 因 为 在 
某 些 情况 下 它 会 导致 异常 的 结果 (Date，1995)。 另 一 方面 ，Codd 主 张 使 用 null 来 表示 缺失 的 
值 (Codd，1990)。 

人 们 普遍 认同 的 是 ， 主 键 的 值 不 可 以 为 mull。 因 此 ， 实 体 完整 性 规则 (entity integrity rule) 
可 以 表述 为 : 主键 属性 (或 主键 属性 的 部 分 ) 取 值 不 可 以 为 null。 
5.4.3 参照 完整 性 

在 关系 数据 模型 中 ， 表 之 间 的 关联 是 使 用 外 键 来 定义 的 。 例如 在 图 5-4 中 ，CUSTOMER 和 
ORDER 表 的 关联 是 通过 在 ORDER 表 中 将 Customer_ID 属 性 作为 外 键 来 实现 的 。 这 就 要 求 我 们 
在 向 ORDER 表 揪 入 一 个 新 的 行 时 ， 必须 确保 下 订单 的 顾客 已 经 存在 于 CUSTOMER 表 中 。 检 查 
图 5-4 中 表 ORDER 里 的 行 ， 可 以 看 到 每 个 订单 上 的 顾客 号 都 已 经 出 现在 CUSTOMER 表 里 。 

参照 完整 性 约束 (referential integrity constraint ) 是 在 两 个 关系 的 行 之 间 维 持 一 致 性 的 规 
则 。 这 个 规则 要 求 ， 如 果 一 个 关系 中 有 外 键 ， 则 每 个 外 键 的 取 值 必须 与 另 一 个 关系 的 主键 取 值 
匹配 ， 或 者 必须 为 null。 读 者 可 以 检查 图 5-4 中 的 表 ， 看 其 是 否 满足 参照 完整 性 约束 的 要 求 。 

利用 关系 模式 的 图 形 表示 ， 可 以 方便 地 表示 出 参照 完整 性 约束 所 必须 遵从 的 关联 。 图 5-5 
显示 了 图 5-3 的 关系 的 模式 。 每 个 外 键 都 有 一 个 稍 头 指向 其 相应 的 主键 。 在 模式 中 ， 每 个 这 样 
的 箭头 都 必须 有 对 应 的 参照 完整 性 约束 。 
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如 何 知 道 是 不 是 允许 外 键 取 null 值 呢 ? 可 以 查看 与 图 5-4 和 图 5-5 相 关联 的 E-R 模 型 图 3-22。 
在 该 图 中 ， 因 为 每 个 订单 必须 有 一 个 顾客 (在 Submits 关 系 上 FCUSTOMER 的 基数 最 小 为 1)， 所 
以 ORDER 关系 的 外 键 Customer_ID 的 值 不 可 以 为 null。 如 果 最 小 的 基数 是 0， 那 么 外 键 的 取 值 就 
可 以 为 null。 在 数据 库 定 义 时 ， 外 键 是 不 是 可 以 取 nul 值 必须 被 定义 为 外 键 属性 的 一 个 性 质 。 

实际 上 ， 外 键 是 不 是 可 以 为 null 的 问题 比 根据 E-R 图 建 模 要 复杂 的 多 ， 并 且 是 目前 最 难以 
决定 的 。 比 如 ， 当 我 们 要 删除 一 个 已 经 下 订单 的 顾客 时 ， 对 订单 数据 有 何 影响 ? 我们 可 能 只 关 
心 销售 情况 ， 而 不 再 关心 这 个 顾客 。 有 三 种 可 能 的 处 理 方法 : 

1) 删除 相关 的 订单 〔 称 为 级 联 删除 )， 此 时 我 们 不 但 丢失 顾客 的 信息 ， 还 失去 它 的 相关 销 
售 记录 。 

2) 禁止 删除 顾客 信息 ， 直 至 该 顾客 的 所 有 订单 信息 已 被 先期 删除 (安全 检查 ) 为 止 。 

3) 将 外 键 的 值 设 为 null (这 是 一 种 例外 情况 ， 虽 然 订单 在 创建 时 其 Customer_ID 的 值 不 可 
以 为 null, 但 是 当 相应 顾客 被 删除 时 ，Customer_ID 的 值 却 可 以 为 null)。 

CUSTOMER 


ORDER 







Order_ID Customer_ID 


ORDER LINE 


Order_ID Product_ID 


PRODUCT 


Product ID Product_Description | Product_Finish Standard_Price 
图 5-5 参照 完整 性 约束 ( 松 谷 家 具 公 司 ) 


在 第 7 章 中 介绍 SQL 数据 库 查 询 语言 时 ， 我 们 会 看 到 这 几 种 处 理 方法 是 如 何 实现 的 。 
5.4.4 动作 断言 

在 第 4 章 中 ， 我 们 讨论 了 业务 规则 ， 并 介绍 了 一 种 称 为 动作 断言 的 业务 规则 。 例 如 ，- 一 个 
典型 的 动作 断言 是 : “只 有 当 一 个 人 购买 了 全 赛季 的 票 后 ， 他 才 可 以 购买 全 明星 赛 的 票 *。 定 义 
和 实现 这 种 规则 的 方法 有 很 多 ， 我 们 会 在 后 面 的 章节 中 讨论 其 中 的 一 些 方法 。 
5.4.5 创建 关系 表 

在 这 一 节 中 ， 我 们 创建 图 5-5 所 示 的 四 张 表 的 定义 ， 这 些 定义 是 利用 SQL 数 据 定义 语言 
的 CREATE TABLE 语 句 创建 的 。 实 际 上 ， 这 些 表 定 义 是 在 数据 库 开 发 过 程 中 稍 后 的 实现 阶段 
才 创建 的 。 出 于 连续 性 考虑 ， 我 们 在 本 章 中 给 出 这 些 示例 表 ， 同 时 也 说 明 如 何 使 用 SQL 语句 来 
实现 刚才 过 论 的 完整 性 约束 。 

SQL 的 表 定 义 在 图 5-6 中 给 出 。 我 们 分 别 创建 关系 模式 中 的 四 个 表 (参见 图 5-5)， 并 定义 每 
个 表 中 的 属性 。 注 意 ， 属 性 的 数据 类 型 和 长 度 来 自前 面 给 出 的 域 定义 (参见 表 5-1)。 比 如 ， 关 
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系 CUSTOMER 中 的 属性 Customer_Name 被 定义 为 VARCHAR ( 可 变 长 字符 串 ) 数据 类 型 ， 其 最 
大 长 度 为 25。 通 过 指定 NOT NULL， 可 以 防止 给 每 个 属性 赋 nujll 值 。 

在 每 个 表 定 义 的 最 后 ， 使 用 PRIMARY KEY 子 句 为 表 定 义 主键 。 表 ORDER_LINE 说 明 如 何 
定义 一 个 复合 的 主键 。 人 在 这 个 例子 里 ，ORDER_LINE 的 主键 是 由 Order_ID 和 Product_ID 组 成 的 
复合 主键 。 四 个 表 中 的 每 个 主键 属性 都 使 用 NOT NULL 进 行 限制 ,这 可 以 人 确保 前 面 小 节 所 讨论 
的 实体 完整 性 。 同 时 应 该 注意 ，NOT NULL 约 束 也 可 以 用 于 非 主键 属性 。 

使 用 图 $-5 所 示 的 图 形 化 模式 ， 可 以 很 容易 地 定义 参照 完整 性 。 每 个 从 外 键 引出 的 箭头 指 
向 其 关联 关系 的 主键 。 在 SQL 的 表 定 义 中 ， 每 个 FOREIGN KEY REFERENCES 语 句 与 这 样 些 
箭头 相对 应 。 在 ORDER 表 中 ， 外 键 CUSTOMER_ID 引 用 表 CUSTOMER 的 主键 ， 主 键 名 也 是 
CUSTOMER_ID。 虽 然 在 这 里 主键 和 外 键 的 名 字 是 相同 的 ， 但 这 并 不 是 必须 的 。 比 如 我 们 也 可 
以 把 外 键 属 性 CUSTOMER_ID 更 名 为 CUST_NO。 但 外 键 和 相应 的 主键 取 值 必 须 来 自 同一 个 域 。 

ORDER_LINE 是 一 个 具有 两 个 外 键 的 表 的 例子 ， 它 的 外 键 分 别 引 用 ORDER 和 PRODUCT 
表 中 的 主键 。 

CREATE TABLE CUSTOMER 










(CUSTOMER_ID VARCHAR(5) NOT NULL, 

CUSTOMER_NAME VARCHAR(25) NOT NULL， 

CUSTOMER ADDRESS VARCHAR(30) NOT NULL， 

CUSTOMER_CITY VARCHAR(20) NOT NULL, 

CUSTOMER_STATE CHAR(2) NOT NULL, 

CUSTOMER_ZIP CHAR(10) NOT NULL, 
PRIMARY KEY (CUSTOMER_ID); 









CREATE TABLE ORDER 






(ORDER_ID CHAR(5) NOT NULL, 
ORDER DATE DATE NOT NULL, 
CUSTOMER_ID VARCHAR(5) NOT NULL, 






PRIMARY KEY (ORDER_ID)， 
FOREIGN KEY (CUSTOMER_ID) REFERENCES CUSTOMER (CUSTOMER_ID); 


CREATE TABLE ORDER_LINE 

















(ORDER_ID CHAR(5) NOT NULL, 
PRODUCT_ID CHAR(5) NOT NULL， 
QUANTITY INT NOT NULL， 


PRIMARY KEY (ORDER_ID, PRODUCT_ID)， 
_ FOREIGN KEY (ORDER_ID) REFERENCES ORDER (ORDER_ID)， 
FOREIGN KEY (PRODUCT_ID) REFERENCES PRODUCT (PRODUCT_ID); 





CREATE TABLE PRODUCT 
(PRODUCT_ID CHAR(5) NOT NULL, 
PRODUCT_DESCRIPTION VARCHAR(25), 
PRODUCT_FINISH VARCHAR(12)， 
STANDARD_PRICE DECIMAL(8,2) NOT NULL, 
ON_HAND INT NOT NULL, 






PRIMARY KEY (PRODUCT_ID); 





图 5-6 SQL 表 定义 


5.4.6 良 构 关系 

在 讨论 规范 化 问题 之 前 ， 我 们 先 解决 一 个 问题 ， 什 么 是 良 构 关系 ?直观 地 说 ， 良 构 关系 
(well-structured relation ) 应 该 有 最 小 的 元 余 ， 并 可 以 让 用 户 在 表 中 插入 、 修改 和 删除 表 中 的 行 ， 
且 不 出 现 错误 和 不 一 致 性 的 情况 。EMPLOYEE1 (参见 图 5-1) 就 是 这 样 一 个 关系 。 表 中 的 每 
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一 行 都 是 关于 一 个 员工 的 数据 ， 对 于 一 个 员工 信息 的 任何 修改 (比如 修改 其 薪水 ) 都 局 限 在 这 一 
行内 。 与 之 相反 ，EMPLOYEE2 (参见 图 5-2b) 不 是 一 个 良 构 关系 。 如 果 检 查 表 中 的 示例 数据 ， 
会 发 现 其 中 有 大 量 的 数据 元 余 。 比 如 ， 员 工 号 为 100、110 和 150 的 员工 ， 他 们 的 Emp_ID、 
Name、Dept_Name 和 Salary 都 在 两 行 中 重复 出 现 。 因 此 如 果 要 修改 员工 100 的 薪水 ， 我 们 就 必 
须 问 时 修改 表 中 的 两 行 (对 于 某 些 员工 ， 可 能 需要 修改 的 行 数 会 更 多 )。 

当 用 户 对 表 中 数据 进行 更 新 时 ， 表 中 数据 的 元 余 可 能 导致 错误 或 不 一 致 的 情况 ( 称 为 异常 
(anomaly))。 有 二 种 可 能 的 异常 : 插入 异常 、 删 除 异 常 和 修改 异常 。 

1. 插入 异常 

假如 我 们 要 为 表 EMPLOYEE2 增 加 一 个 新 的 员工 。 这 个 关系 的 主键 由 Emp_ID 和 
Course_Title 组 成 (如 前 所 述 )。 因 此 ， 要 插入 一 个 新 行 ， 用 户 必须 为 Emp_ID 和 Course_Title 属 
性 都 提供 值 ( 因 为 主键 属性 不 能 为 null 值 或 是 不 存在 )。 这 是 一 种 异常 ， 因 为 用 户 应 该 可 以 在 不 
提供 课程 信息 的 情况 下 输入 员工 信息 。 

2. 删除 异常 

假如 从 表 中 删除 员工 号 140 的 数据 ， 则 会 导致 以 下 信息 的 丢失 : 该 员工 在 12/8/200X 完 成 课 
时 (Tax Acc )。 事 实 上 ， 这 样 会 丢失 该 课程 的 某 次 授课 在 12/8/200X 结 束 这 一 信息 。 

3. 修改 异常 

假如 员工 100 增 加 了 工资 ， 我 们 必须 在 两 行 中 记录 这 一 修改 (该 员工 在 图 5-2 中 出 现 两 次 )， 
不 则 就 会 出 现 数据 不 一 致 的 情况 。 

这 些 异 党 说 明 表 EMPLOYEE2 不 是 一 个 良 构 关系 。 这 个 关系 的 问题 在 于 ， 它 同时 包含 实体 
EMPLOYEE 和 COURSE 的 数据 。 在 后 面 的 内 容 中 ， 我 们 将 使 用 规范 化 理论 将 它 分 解 为 两 个 关 
系 。 其 中 -个 关系 是 EMPLOYEE1 (参见 图 5-1)， 另 一 个 关系 是 EMP_COURSE， 在 图 5-7 中 显 
水 了 该 关系 并 带 有 示例 数据 。 该 关系 的 主键 由 属性 Emp_ID 和 Course_Title 组 成 ， 在 图 5-7 中 我 们 
使 用 下 划 线 标注 这 两 个 属性 。 读 者 可 以 检查 图 5-7 中 的 关系 EMP_COURSE 没 有 前 面 提 到 的 异常 
情况 ， 央 而 该 关系 是 良 构 的 。 


Course_Title Date_Completed 


SPSS 6/19/200X 
Surveys 10/7/200X 
Tax Acc 12/8/200X 


SPSS 1/12/200X 
C++ 4/22/200X 
SPSS 6/19/200X 
Java 8/12/200X 





图 5-7 EMP_COURSE 
5.5 将 EER 图 转化 为 关系 


任 逻 辑 设计 中 ， 我 们 可 以 将 在 概念 设计 中 创建 的 E-R (EER) 图 转化 为 关系 数据 模式 。 这 
个 过 程 的 输入 是 第 3、4 章 中 所 研究 的 E-R (EER ) 图 ， 输 出 是 在 本 章 前 面 两 节 介绍 的 关系 模式 。 

道 过 使 用 一 组 定义 好 的 规则 ， 可 以 方便 地 将 E-R 图 转化 (映射) 为 关系 。 实 际 上 ， 许 多 
CASE 工 具 可 以 自动 地 完成 转化 中 的 许多 步骤 。 但 是 由 于 以 下 的 三 个 原因 ， 还 是 应 该 了 解 这 个 
过 程 的 具体 步骤 : 

1) CASE 工 具 往往 不 能 为 更 复杂 的 数据 联系 建 模 ， 如 三 元 联系 、 超 类 型 / 子 类 型 联系 等 。 在 
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这 些 情 况 下 ， 用 户 必 须 自 行进 行 转化 。 

2) 有 时 候 存在 多 个 正确 的 转化 方案 ， 用 户 需 要 从 中 选择 特定 的 一 个 解决 方案 。 

3) 用 户 需 要 对 CASE 工 具 的 转化 结果 进行 质量 检查 。 

在 王 面 的 讨论 中 ， 我 们 利用 第 3、4 章 给 出 的 例子 介绍 转化 的 步骤 。 首 先 回 忆 一 焉 在 这 两 章 
中 我 们 定义 的 三 种 实体 : 

1) 常规 实体 是 独立 存在 的 实体 ， 通 常 代 表现 实 世界 中 的 对 象 ， 如 人 和 商品 等 。 常 规 实体 使 
用 单线 矩形 表示 。 

2) 弱 实 体 必须 与 属 主 (常规) 实体 类 型 建立 标识 联系 才 可 以 存在 。 罚 实体 使 用 双 线 矩形 表示 。 

3) 关联 实体 是 由 其 他 实体 类 型 间 的 多 对 多 联系 而 形成 的 。 关 联 实体 包含 萎 形 联系 符号 的 单 
线 和 矩形 表示 。 
5.5.1 第 1 步 : 映射 常规 实体 

ER 图 中 的 每 一 个 常规 实体 可 以 转化 为 一 个 关系 ， 通 常 关系 的 名 字 就 是 实体 类 型 的 名 字 。 
实体 类 型 中 的 每 一 个 简单 属性 成 为 关系 的 一 个 属性 、 实 体 类 型 的 标识 符 就 是 相应 关系 的 主键 。 
读者 应 该 验证 一 下 以 确定 这 个 主键 满足 我 们 在 第 3 章 中 所 列 出 的 标识 符 的 期 望 性 质 。 

图 5-8a 表 示 的 是 第 3 章 中 松 谷 家 具 公 司 的 CUSTOMER 实 体 类 型 (参见 图 3-22 )。 相 应 的 
CUSTOMER 关 系 的 图 形 表示 出 现在 图 5-8b 中 。 为 使 图 简化 一 些 、 在 这 个 图 和 本 入 的 随后 的 图 
中 我 们 只 给 出 每 个 关系 的 一 些 重要 的 属性 。 


CUSTOMER | 一 一 Customer_Address 


a) CUSTOMER 实 体 类 型 






CUSTOMER 


Customer_ID Customer_Address 


b) 关系 CUSTOMER 
图 5-8 映射 常规 实体 CUSTOMER 


复合 属性 当 -- 个 常规 实体 类 型 具有 复合 属性 时 ， 只 有 该 属性 的 那些 简单 的 组 成 属性 包含 
在 新 的 关系 中 。 图 $-9 显 示 了 图 $-8 中 例子 的 一 个 变形 ， Customer_Address 是 一 个 由 Street、City、 
State 和 Zip 构 成 的 复合 属性 (参见 图 5-9a)。 这 个 实体 被 映射 成 图 5-9b 中 的 关系 CUSTOMER， 它 
只 包含 一 个 简单 的 地 址 属性 。 

多 值 属 性 ” 当 一 个 常规 实体 类 型 包含 多 值 属性 时 ， 要 建立 两 个 新 关系 (而 不 是 一 个 )。 第 
一 个 关系 包含 实体 类 型 除 多 值 属性 以 外 的 所 有 属性 。 第 二 个 关系 只 包含 两 个 属性 ， 这 两 个 属性 
共同 构成 第 二 个 关系 的 主键 。 其 中 一 个 属性 是 第 一 个 关系 的 主键 ， 并 是 第 二 个 关系 的 外 键 。 另 
一 个 就 是 那个 多 值 的 属性 。 第 二 个 关系 的 名 字 应 该 可 以 描述 该 多 值 属性 的 含义 。 

图 5-10 给 出 应 用 这 个 过 程 的 一 个 例子 ， 它 来 源 于 松 谷 家 具 公 司 的 EMPLOYEE 实 体 类 型 
(参见 图 3-22)。 如 图 5-10a 所 示 ，EMPLOYEE 有 多 值 属性 Skill。 图 5-10b 说 明 创 建 了 两 个 关系 ， 
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第 一 个 关系 (EMPLOYEE ) 的 主键 为 Employee_ID。 第 二 个 关系 (EMPLOYEE_SKILL ) 有 两 
个 属性 Employee ID 和 Skill， 它 们 组 成 该 关系 的 主键 。 主 键 和 外 键 间 的 联系 用 图 中 的 箭头 表明 。 

关系 EMPLOYEE_SKILL 不 包含 任何 非 键 属 性 〈 也 称 为 描述 符 )。 每 一 行 只 是 记录 某 个 员 
工 所 具有 的 某 项 技能 。 此 时 可 以 建议 用 户 给 关系 增加 新 的 属性 。 比 如 ， 属 性 Years_Experience 
和 Certification_Data 就 是 适合 该 关系 的 新 值 。 





Customer ID 


CUSTOMER 


a) 带 有 复合 属性 的 实体 类 型 CUSTOMER 








Customer_ID Customer_Name Street 


b) 包含 详细 地 址 的 关系 CUSTOMER 
图 5-9 映射 复合 属性 





a) 带 有 多 值 属性 的 实体 类 型 Employee 


EMPLOYEE 
Employee_ID | Employee_Name | Employee_Address 


EMPLOYEE SKILL 






b) 映射 多 值 属 性 
图 5-10 映射 带 有 多 值 属性 的 实体 
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5.5.2 第 2 步 : 映射 弱 实 体 

弱 实 体 不 具有 独立 的 存在 性 ， 它 的 存在 依赖 于 和 一 个 称 为 属 主 的 实体 建立 标识 联系 。 弱 实 
体 类 型 没有 完整 的 标识 符 ， 只 具有 一 个 称 为 部 分 标识 符 的 属性 ， 该 属性 可 以 标识 属于 同一 个 标 
识 属 主 实例 的 弱 实 体 的 多 次 出 现 。 

下 面 的 过 程 假设 已 经 在 步骤 1 中 为 标识 实体 类 型 创建 相应 的 关系 。 如 果 还 没有 创建 ， 则 应 
该 使 用 步骤 1 中 描述 的 方法 创建 关系 。 

对 于 每 一 个 弱 实 体 类 型 ， 为 其 创建 一 个 包含 所 有 简单 属性 (或 者 复合 属性 的 组 成 部 分 ) 的 
关系 。 然 后 将 标识 关系 的 主键 作为 新 关系 的 外 键 ， 新 关系 的 主键 是 由 这 个 标识 实体 的 主键 和 弱 
实体 类 型 的 部 分 标识 符 所 组 成 的 。 

图 5-11 是 这 个 过 程 的 一 个 例子 。 图 $-1i 中 有 能 实 体 类 型 DEPENDENT 和 其 相应 的 标识 实体 
类 型 EMPLOYEE， 它 们 之 间 的 标识 联系 为 Has (参见 图 3-5)。 请 注意 ，DEPENDENT 关 系 的 部 
分 标识 符 Dependent_Name 是 由 First_Name、Middle_Initial 和 Last_Name 组 成 的 复合 属性 。 我 们 
假定 ， 对 于 一 个 给 定 的 员工 ， 这 些 属性 可 以 惟一 标识 他 的 亲属 (职业 拳击 家 George Foreman 是 
个 例外 ， 他 所 有 的 孩子 的 名 字 都 是 和 他 相同 的 )。 

图 5-11b 中 是 映射 这 个 E-R 图 而 得 到 的 两 个 关系 。DEPENDENT 的 主键 由 四 个 属性 组 成 : 
Employee_ID、First_Name、Middle_Initial 和 Last_Name。Date_of_Birth 和 Gender 是 非 键 属性 。 
图 中 使 用 箭头 来 表示 外 键 和 主键 间 的 联系 。 


First_ Name Middle_Initial 


Employee_ID 


EMPLOYEE 


EMPLOYEE 





a) 加 实体 DEPENDENT 







Employee_ID | Employee_Name 






DEPENDENT 


b) 映射 弱 实 体 得 到 的 关系 
图 5-11 映射 弱 实 体 的 例子 
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5.5.3 第 3 步 : 映射 二 元 联系 

表示 联系 的 过 程 不 但 取决 于 联系 的 度 (一 元 、 二 元 、 三 元 )， 还 取决 于 联系 的 基数 。 在 下 
面 的 讨论 中 ， 我 们 分 别 描 述 其 中 比较 主要 的 几 种 情况 。 

映射 二 元 的 一 对 多 联系 ”对 于 每 一 个 一 元 的 1:M 联 系 ， 首 先 使 用 步骤 1 中 所 介绍 的 方法 为 这 
两 个 参与 联系 的 实体 类 型 分 别 创建 关系 。 接 下 来 ， 将 在 联系 中 作为 “一 ” 方 的 主键 属性 (属性 
组 ) 填 加 到 联系 中 作为 “多 ” 方 所 对 应 的 关系 里 ， 作 为 它 的 外 键 (可 以 这 样 记 住 这 个 规则 : 主 
键 合并 到 多 的 一 方 )。 

为 说 明 这 一 简单 过 程 ， 我 们 使 用 松 谷 家 县 公司 (参见 图 3-22) 中 在 CUSTOMER 和 ORDER 
之 间 的 Submits 联 系 ， 图 5-12a 显 示 了 这 个 1:M 的 联系 。 图 5-12b 显 示 了 使 用 上 面 的 规则 对 这 个 带 
有 1:M 联 系 的 实体 类 型 映射 所 得 到 的 结果 。 关 系 CUSTOMER 的 主键 Customer_ID (1 的 一 方 ) 
作为 ORDER (M 的 一 方 ) 的 外 键 ， 图 中 使 用 箭头 标 出 这 个 外 键 联系 。 


Customer_ Address 
CUSTOMER 







Customer_ID 








Order_jD 
CUSTOMER 


| Customer_ID | Customer_ Name Customer ass | 


a) CUSTOMER 和 ORDER 过 间 的 联系 











ORDER 
| Order_ID | Order_Date Customer_!D 





b) 映射 联系 
图 5-12 映射 1:M 联 系 的 例子 
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映射 二 元 的 多 对 多 联系 ”假设 在 实体 类 型 A 和 B 之 间 有 一 个 二 元 的 多 对 多 (M:N) 联系 。 对 
于 这 个 联系 ， 我 们 创建 一 个 新 的 关系 C。C 中 包含 参与 联系 的 实体 类 型 A 和 B 的 主键 属性 作为 它 
的 外 键 属性 ， 并 组 合成 为 C 的 主键 。C 中 同时 包含 所 有 与 这 个 M:N 联系 相关 的 非 键 属性 。 

图 5-13 是 应 用 这 个 规则 的 例子 。 图 5-13a 是 松 谷 家 具 公 司 (参见 图 3-22) 的 实体 类 型 
VENDOR 和 RAW MATERIALS 之 间 的 联系 Suppilies。 图 5-13b 中 是 从 这 些 实体 类 型 和 联系 
Supplies 中 所 生成 的 三 个 关系 (VENDOR、RAW MATERIALS 和 QUOTE )。 首 先 为 两 个 常规 实 
体 类 型 VENDOR 和 RAW MATERIALS 分 别 创 建 关 系 ， 然 后 为 联系 Supplies 创 建 关系 ( 即 图 
5-13b 中 的 QUOTE ) 。 关 系 QUOTE 的 主键 是 由 Vendor ID 和 Material_ID 组 成 的 ， 它 们 分 别 是 
VENDOR 和 RAW MATITERIALS 的 主键 。 如 图 所 示 ， 这 些 属性 在 QUOTE 中 是 外 键 ， 但 却 是 其 所 
在 关系 的 主键 。QUOTE 同 时 包含 非 键 属性 Unit_Price。 





a) 多 对 多 联系 (M:N) 
RAW MATERIALS 





Material_ID | Standard_Cost | Unit_of_Measure 









MateriaLID | Vendor ID | Unit_Price 





VENDOR 


Vendor_ID Vendor_Address 


b) 映射 所 得 到 的 一 个 关系 
图 5-13 映射 M:N 联系 的 例子 
映射 二 元 的 一 对 一 联系 ”二 元 的 1:1 联 系 可 以 看 作 是 1:M 联 系 的 特殊 情况 。 将 这 种 联系 映射 
为 关系 需要 两 个 步 又 。 首 先 创建 两 个 关系 ， 分 别针 对 参与 联系 的 实体 类 型 ; 然后 将 其 中 一 个 关 
系 的 主键 加 到 另 一 个 关系 中 作为 它 的 外 键 。 
通常 来 说 ， 在 一 个 1:1 联 系 中 ， 联 系 的 一 方 总 是 可 选 的 ， 而 另 一 方 是 强制 的 ( 可 以 参考 图 
3-1 中 对 这 些 术 语 的 表示 方法 )。 应 该 将 联系 中 必须 出 现 一 方 的 主键 加 到 可 选 一 方 的 关系 中 来 作 
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为 外 键 ， 这 样 就 可 以 避免 在 外 键 属性 中 存储 nul 值 的 问题 。 所 有 与 联系 相关 的 属性 也 要 被 添加 
到 外 键 所 在 的 关系 中 。 

图 5-14 给 出 应 用 这 一 过 程 的 例子 。 图 5-14a 显 示 了 实体 类 型 NURSE 和 CARE CENTER 之 间 
的 二 元 1:1 联 系 。 每 一 个 诊疗 中 心 必须 有 一 个 负责 该 中 心 的 护士 ， 所 以 从 CARE CENTER 到 
NURSE 的 联系 是 强制 的 ， 而 从 NURSE 到 CARE CENTER 的 联系 则 是 可 选 的 〈 因 为 某 个 护士 既 
可 能 负责 该 中 心 也 可 能 不 负责 该 中 心 ) 。 联 系 In_Charge 中 有 属性 Date_Assigned。 

图 5-14b 给 出 将 这 个 联系 映射 为 关系 的 结果 。 关 系 NURSE 和 CARE CENTER 分 别 根据 实体 
类 型 创建 。 由 于 CARE CENTER 是 可 选 的 联系 参与 者 ， 所 以 为 它 添加 外 键 ， 这 里 外 键 的 名 称 是 
Nurse_in_Charge。 它 和 Nurse_ID 有 相同 的 域 ， 与 主键 之 间 的 联系 也 在 图 中 标 出 。 属 性 Date_ 


Assigned 也 位 于 CARE CENTER 关 系 中 ， 而 且 它 不 允许 有 null 值 。 









Date_Assigned 


NURSE 


Nurse_ID | Name Date_of_Birth ] 


CARE CENTER 






a) 二 元 的 对 一 联系 












Center_Name | Location 


Date_Assigned 


b) 关系 的 结果 
图 5-14 ”映射 二 元 的 一 对 一 联系 
5.5.4 第 4 步 : 映射 关联 实体 
在 第 3 章 中 曾 提 到 ， 当 数据 建 模 人 员 遇 到 多 对 多 联系 时 ， 他 可 以 选择 在 E-R 模 型 中 将 该 联系 
建 模 为 相应 的 关联 实体 。 当 最 终 用 户 更 愿意 将 这 种 联系 看 作 是 实体 类 型 ， 而 不 是 M:N 联系 时 ， 
这 种 方法 尤为 合适 。 映射 关联 实体 所 涉及 的 步 又 和 前 面 步骤 3 中 映射 M:N 联 系 的 步 又 实质 上 是 
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类 似 的 。 

首先 创建 三 个 关系 : 分 别针 对 参与 联系 的 两 个 实体 类 型 和 关联 实体 本 身 。 我 们 称 对 应 于 关 
联 实体 的 关系 为 关联 关系 (associative relation)。 接 下 来 的 步骤 取决 于 在 E-R 模 型 中 是 不 是 为 关 
联 实体 赋予 标识 符 。 

没有 赋予 标识 符 ” 如果 没有 赋予 标识 符 ， 则 默认 情况 下 关联 关系 的 主键 由 其 他 两 个 关系 的 
主键 属性 构成 ， 这 些 属 性 在 关联 关系 中 同时 作为 外 键 来 引用 另外 的 两 个 关系 。 

图 5-15 是 这 种 情况 的 一 个 例子 。 图 5-15a 中 的 关联 实体 ORDER LINE 链 接 松 谷 家 具 公 司 
(参见 图 3-22) 中 实体 类 型 ORDER 和 PRODUCT 之 间 的 关联 。 图 5-15b 显 示 映 射 后 生成 的 三 个 关 


系 ， 注意， 这 个 例子 的 结果 和 图 5-13 中 M:N 映射 的 结果 相 类 似 。 











PRODUCT 







Product_ ID Standard_Price 





Product_Finish 





a) 关联 实体 


Product_ 
Description 
ORDER 


ORDER LINE 






Product_ID | Order_ID Quantity 







PRODUCT 


Product_ID | Product_Description | Product_Finish Standard_Price 








b) 得 到 的 “个 关系 
图 5-15 上 映射 关联 实体 
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赋予 标识 符 ”有 时 候 ， 数 据 建 模 人 员 会 在 E-R 模 型 上 为 关联 实体 类 型 赋予 标识 符 〈 称 为 代 
理 标识 符 或 代理 键 ) ， 这 通常 出 于 以 下 两 个 原因 : 

1) 关联 实体 类 型 有 最 终 用 户 所 熟悉 的 自然 标识 符 。 

2) 软 认 标识 符 (由 参与 联系 的 实体 类 型 标识 符 所 构成 ) 不 能 惟一 标识 关联 实体 的 实例 。 

在 这 种 情况 下 ， 关 联 实体 的 映射 要 作 如 下 修改 。 首 先 ， 用 前 面 所 述 的 方法 创建 新 的 关系 
(关联 关系 ) 来 表示 关联 实体 ， 但 应 该 将 E-R 图 中 所 赋予 的 标识 符 (而 不 是 默认 的 主键 ) 作为 其 
主键 ， 然 后 将 参与 联系 的 实体 类 型 的 主键 添加 到 该 关联 关系 中 作为 外 键 。 

图 5-16 是 采用 这 种 过 程 的 例子 。 图 5-16a 中 有 关联 实体 类 型 SHIPMENT， 它 链接 了 实体 类 
型 CUSTOMER 和 VENDOR。 用 Shipment_No 作 为 SHIPMENT 的 标识 符 是 由 于 以 下 两 个 原因 : 

1) 最 终 用 户 熟 悉 Shipment_No 这 个 实体 的 自然 标识 符 。 

2) 由 Customer_ID 和 Vendor_ID 所 构成 的 默认 标识 符 不 能 够 惟一 标识 SHIPMENT 实 例 。 这 是 
内 为 一 个 供 货 商 可 以 为 一 个 顾客 多 次 送 货 ， 即 使 再 添加 属性 Date 也 不 能 保证 其 惟一 性 ， 因 为 某 
个 供 货 商 可 能 在 一 天 内 多 次 供 货 ， 而 代理 键 Shipment_No 可 以 惟一 标识 每 一 次 送 货 。 

图 5-16b 是 映射 该 实体 到 关系 的 结果 ， 新 的 关联 关系 名 为 SHIPMENT。 该 关系 的 主键 是 
Shipment_No， 则 时 包含 Customer_ID 和 Vendor_ID 作 为 外 键 ， 以 及 属性 Date 和 Amount 是 非 键 





a) 关联 实体 (SHIPMENT ) 
CUSTOMER 


OMer Mputes) 


SHIPMENT 
Shipment_No 








VENDOR 


| aa | Address | (Other Abues | 


b) 得 到 的 :个 关系 
图 5-16 映射 带 有 标识 符 的 关联 实体 
5.5.5 第 5 步 : 映射 一 元 联系 
在 第 3 章 中 ， 我 们 定义 一 元 联系 是 在 一 个 实体 类 型 的 实例 间 的 联系 ， 一 元 联系 又 称 为 递归 
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联系 。 一 元 联系 最 重要 的 两 种 形式 是 一 对 多 和 多 对 多 ， 由 于 它们 的 映射 方法 有 所 不 同 ， 因 此 下 
面 我 们 对 这 两 种 情况 分 别 进行 说 明 。 

一 元 的 一 对 多 联系 ”首先 使 用 步骤 1 的 方法 将 一 元 联系 的 实体 类 型 映射 到 关系 ， 然 后 在 这 
个 关系 内 添加 一 个 引用 主键 值 的 外 键 属性 (这 个 外 键 与 主键 必须 有 相同 的 域 ) 。 递 归 外 键 
(recursive foreign key) 是 引用 自身 所 在 关系 主键 值 的 外 键 。 

图 $-17a 显 示 了 一 个 一 元 的 一 对 多 联系 Manages， 它 将 组 织 内 的 每 一 个 员工 和 该 组 织 内 作为 
他 的 经 理 的 另 一 个 员工 联系 起 来 。 每 个 员工 具有 一 个 经 理 ， 而 一 个 员工 可 以 管理 零 到 多 个 员工 。 

图 5-17b 中 的 EMPLOYEE 关 系 是 映射 实体 和 相应 联系 的 结果 ， 其 中 的 递归 外 键 名 为 
Manager_ ID， 它 与 关系 的 主键 Employee_ID 有 相同 的 域 。 关 系 中 的 每 一 行 存 储 员 工 的 如 下 信息 : 
Employee_ID、Name、Birthdate 和 Manager_ID (就 是 该 员工 的 经 理 的 Employee_ID )。 注 意 ， 


Manager_ID 是 外 键 ， 它 引用 关系 的 主键 Employee_ID 。 






Employee_fD 






~ 
Pe 


EMPLOYEE 


a) 带 有 Manages 联 系 的 实体 EMPLOYEE 





EMPLOYEE 





b) 带 有 递归 外 键 的 关系 EMPLOYEE 
图 5-17 映射 一 元 的 一 对 多 联系 


一 元 的 多 对 多 联系 ”对 于 这 种 类 型 的 联系 ， 需 要 创建 两 个 关系 : 一 个 表示 联系 中 的 实体 类 
型 ， 另 一 个 是 关联 关系 ， 用 于 表示 这 个 M:N 联系 本 身 。 其 中 ， 关联 关系 的 主键 由 两 个 属性 构成 ， 
2 要 有 同样 的 命名 ) 的 取 值 都 来 源 于 另 一 个 关系 的 主键 。 联 系 的 非 键 属性 也 加 到 关联 

系 5 

图 5-18 是 映射 一 元 的 多 对 多 联系 的 一 个 例子 。 图 5-18a 表 示 标 准 件 (ITEM) 闻 的 bill-of- 
materials 联 系 ， 即 每 个 ITEM 由 许多 个 其 他 ITEM 或 COMPONENT 组 成 { 第 3 章 中 介绍 过 这 个 结 
构 ， 图 3-13 给 出 过 这 个 例子 )。 其 中 的 联系 ( 称 为 Contains) 是 M:N 的 ， 因为 每 个 ITEM 可 以 包 
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含 多 个 组 成 它 的 ITEM ， 反 过 来 一 个 ITEM 也 可 以 用 于 组 装 多 个 ITEM.。 

图 5-18b 是 映射 这 个 实体 和 相应 联系 后 生成 的 关系 。 关 系 ITEM 直 接 由 相应 的 实体 类 型 生成 。 

关联 关系 COMPONENT 的 主键 由 两 个 属性 (ltem_No 和 Component_No) 组 成 。 关 系 中 还 有 一 

个 非 键 属性 Quantity ， 用 于 表示 组 成 ITEM 的 某 种 其 他 ITEM 的 数目 。 注意，Item_No 和 
Component_No 这 两 个 属性 都 引用 关系 ITEM 的 主键 (Item_No ) 。 

我 们 可 以 很 容易 地 查询 以 上 的 关系 来 决定 某 个 标准 件 的 组 成 情况 。 下 面 的 SQL 查 询 会 列 出 
Item_No 为 100 的 标准 件 的 所 有 组 件 (和 相应 数量 ): 

SELECT Component No, Quantity 


FROM COMPONENT 
WHERE Item No=100; 





a) 材料 单 联系 (M:N) 
ITEM 


Hem_No | Name | Unit_Cost 


COMPONENT—、 


ltem_No | Component_No 




















Quantity 





b) 关系 ITEM 和 ICOMPONENT 


图 5-18 映射 一 元 的 多 对 多 联系 


5.5.6 第 6 步 : 映射 三 元 (多 元 ) 联系 

在 第 3 章 中 ， 定 勾 三 元 联系 为 三 个 实体 类 型 之 间 的 联系 ， 在 该 章 中 我 们 建议 将 三 元 联系 转 
化 为 相应 的 关联 实体 以 更 准确 地 表示 它们 之 间 的 参与 约束 。 

为 映射 链接 三 个 常规 实体 联系 的 关联 实体 ， 我 们 创建 新 的 关联 关系 。 默 认 情况 下 ， 新 关系 
的 主键 由 参与 该 联系 的 三 个 实体 类 型 的 主键 属性 组 成 (在 某 些 情况 下 ， 还 需要 增加 其 他 属性 以 
保证 主键 的 惟一 性 )。 在 新 关系 中 ， 这 些 属 性 作为 外 键 引 用 相应 实体 类 型 的 主键 。 其 他 属于 关 
联 实体 类 型 的 属性 也 要 成 为 新 关系 中 的 属性 。 

图 5-19 是 一 个 映射 三 元 联系 (表示 为 关联 实体 类 型 ) 的 例子 。 图 $-19a 是 E-R 图 的 片段 (或 
视图 ) ， 它 表示 病人 从 医生 处 得 到 治疗 。 相 应 的 关联 实体 类 型 PATIENT TREATMENT 有 属性 
DPate、Time 和 Results ， 该 实体 类 型 的 每 个 实例 都 有 这 些 属性 的 值 。 
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图 5-19b 是 映射 这 个 视图 的 结果 。 关 系 PATIENT TREATMENT 的 外 键 Patient_ID、 
Physician_ID 和 Treatment_Code 分 别 是 其 他 关系 的 主键 ， 并 是 PATIENT TREATMENT 主键 的 组 
成 部 分 。 需 要 注意 的 是 ，Patient_ID 、Physician_1D 和 Treatment_Code 并 不 能 惟一 标识 其 一 次 治 
疗 ， 因 为 一 个 病人 可 能 在 同一 个 医生 处 接受 过 多 次 相同 的 治疗 。 那 么 将 属性 Date (或 其 他 的 属 
性 ) 也 作为 主键 的 一 部 分 是 不 是 可 以 保证 其 惟一 性 呢 ? 如 果 某 个 病人 在 某 一 天 只 从 某 个 医生 处 
接受 一 次 治疗 的 话 是 可 以 的 ; 但 情况 可 能 并 非 如 此 。 例 如, 一 个 病人 可 能 在 早上 接受 一 次 治疗 ， 
然后 在 下 午 接 受 一 次 同样 的 治疗 。 为 解决 这 个 问题 ， 我 们 将 Time 也 作为 主键 的 一 部 分 。 因 此 关 
系 PATIENT TREATMENT 的 主键 由 图 5-19b 中 的 五 个 属性 组 成 : Patient_ID 、Physician_ID、 


Treatment_Code、Date 和 Time。 关 系 中 惟一 -的 非 键 属性 是 Results。 
PHYSICIAN 


PATIENT 










Patient_iD 






Physician_ID 
















ENT 


a) 带 有 关联 实体 的 “元 联系 
PATIENT 


Patient_ID | Patient_Name 


PHYSICIAN 
Physician_ID | Physician_Name 


PATIENT TREATMENT 


由 Scan roament Code | Date | 


TREATMENT 


Treatment_Code 


b) 映射 :元 联系 
图 5-19 映射 三 元 联系 
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5.5.7 第 7 步 : 映射 超 类 型 / 子 类 型 联系 

关系 数据 模型 并 不 直接 支持 超 类 型 / 子 类 型 联系 。 幸 运 的 是 ， 数 据 库 设 计 人 员 可 以 采用 多 
种 其 他 的 策略 在 关系 模型 中 表示 这 种 联系 (Chouinard，1989)。 出 于 讨论 的 需要 ， 我 们 采用 下 
面 的 方法 ， 这 也 是 最 常 使 用 的 一 种 方法 : 

D 为 超 类 型 和 它 的 每 一 个 子 类 型 创建 单独 的 关系 。 

2) 将 子 类 型 所 共有 的 属性 赋予 超 类 型 对 应 的 关系 中 ， 包 括 主键 。 

3) 子 类 型 对 应 的 关系 只 包含 它 特有 的 属性 以 及 超 类 型 的 主键 。 

4) 将 超 类 型 的 一 个 (或 多 个 ) 属性 用 作 子 类 型 鉴别 符 (第 4 章 中 已 经 讨论 子 类 型 鉴别 符 的 
作用 )。 

图 5-20 和 图 5-21 是 应 用 这 种 方法 的 例子 。 在 图 5-20 中 ，EMPLOYEE 是 超 类 型 ，HOURLY 
EMPLOYEE、SALARIED EMPLOYEE 和 CONSULTANT 是 它 的 子 类 型 (该 例子 在 第 4 章 中 介绍 
过 ,图 5-20 再 现 了 图 4-8)。 其 中 属性 Employee_Number 是 EMPLOYEE 的 主键 ， 属 性 Employee_ 
Type 是 子 类 型 鉴别 符 。 


Address 


Employee_ Name Employee_Type 
Employee_Number EMPLOYEE 


Employee._ Type= 


em 


“SG" 


HOURLY SALARIED 
EMPLOYEE EMPLOYEE CONSULTANT 
Hourly_Rate Annual_Salary Stock_Options Biling_Rate 


图 5-20 超 类 型 / 子 类 型 联系 


图 5-21 是 应 用 上 述 规则 将 图 5-20 的 联系 映射 为 关系 的 结果 。 超 类 型 EMPLOYEE 和 它 的 三 个 
子 类 型 都 有 相应 的 关系 。 这 四 个 关系 的 主键 都 是 Employee_Number， 但 使 用 不 同 的 前 缀 以 加 以 
区 别 。 例 如 ，S_Employee_Number 是 关系 SALARIED_EMPLOYEE 的 主键 名 。 和 子 类 型 中 的 主键 
同时 又 是 外 键 ， 它 们 对 超 类 型 主键 加 以 引用 (如 图 中 箭头 所 示 )。 此 外 ， 每 个 子 类 型 关系 中 也 
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包含 其 所 特有 的 属性 。 

对 于 每 个 子 类 型 ， 可 以 通过 一 个 联结 它 和 它 的 超 类 型 的 SQL 语句 产生 一 个 包含 它 的 所 有 属 
性 ( 独 有 的 和 继承 的 ) 的 关系 。 例 如 ， 假 设 我 们 想 要 显示 包含 SALARIED_EMPLOYEE 的 所 有 
属性 的 表 ， 就 可 以 使 用 下 面 的 语句 : 

SELECT * 

FROM EMPLOYEE, SALARIED EMPLOYEE 

WHERE Employee Number = §_ Employee Number; 

虽然 我 们 还 没有 正式 学 习 SQL 语句 ， 但 是 从 命令 中 可 以 很 容易 看 出 ， 该 语句 会 连接 关系 
EMPLOYEE 和 SALARIED_EMPLOYEE 表 ， 产 牛 包含 它们 所 有 属性 的 结果 表 。 

EMPLOYEE 


Employee_Number | Employee Name | Address | Employee_Type 


3 





HOURLY_EMPLOYEE 





H_Employee_Number | Hourly_ Rate 








SALARIED_EMPLOYEE 


S_Employee_Number | Annual_Salary | Stock_Options 


CONSULTANT 


C_Employee_Number Biling_Rate 


图 5-21 将 超 类 型 / 子 类 型 联系 映射 成 关系 















5.6 规范 化 介绍 


规范 化 是 用 来 确定 将 哪些 属性 组 合 在 一 个 关系 中 的 过 程 。 在 第 3 章 和 第 4 章 的 概念 数据 建 模 
中 ， 读 者 都 是 利用 直觉 来 为 实体 类 型 分 配属 性 的 。 在 本 章 的 前 面部 分 ， 我 们 学 习 了 如 何 将 E-R 
模型 转化 为 关系 。 在 进一步 进行 物理 设计 以 前 ， 我 们 需要 一 种 方法 来 确认 逻辑 设计 的 有 效 性 。 
规范 化 是 用 来 确认 和 改进 逻辑 设计 的 主要 工具 ， 它 可 以 确保 设计 满足 特定 的 约束 ， 以 避免 数据 
的 无 谓 元 余 。 

我 们 在 前 面 已 经 讨论 过 良 构 关 系 ， 但 是 我 们 还 需要 更 形式 化 地 定义 良 构 关 系 ， 并 介绍 良 构 
关系 的 设计 步 又 。 规 范 化 (normalization) 是 将 含有 异常 的 关系 分 解 为 更 小 的 ， 良 构 的 关系 的 过 
程 。 例 如 ， 我 们 可 以 使 用 规范 化 的 原则 将 关系 EMPLOYEE2 (含有 宛 余 ) 转化 为 关系 
EMPLOYEE1 (参见 图 5-1) 和 关系 EMP_COURSE (参见 图 5-7 )。 

5.6.1 规范 化 的 步骤 

规范 化 可 以 分 为 几 个 阶段 来 实现 和 理解 ， 每 一 个 阶段 都 对 应 有 一 个 范式 (参见 图 $5-22)。 
范式 (normal form) 是 根据 函数 依赖 (或 是 属性 间 联 系 ) 对 关系 应 用 某 些 简 单 准则 后 所 得 到 的 
关系 的 状态 。 我 们 在 本 节 对 这 些 范式 进行 简单 的 介绍 ， 在 以 后 的 小 节 中 会 有 更 详细 的 说 明 。 
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1) 第 一 范式 ”任何 多 值 属性 (又 称 重复 组 ) 都 被 去 除 ， 表 中 所 有 行 与 列 交 叉 处 都 只 有 一 个 
值 (容许 为 null) (如 图 5-2b 所 示 )。 

2) 第 二 范式 ”所 有 部 分 函数 依赖 都 被 去 除 。 

3) 第 三 范式 所 有 传递 依赖 都 被 去 除 。 

4) Boyce/Codd 范 式 所 有 其 他 的 由 国 数 依 赖 导 致 的 异常 都 被 去 除 。 

5) 第 四 范式 所 有 多 值 依赖 都 被 去 除 。 

6) 第 五 范式 所 有 其 他 的 异常 都 被 去 除 。 

在 本 章 中 我 们 讨论 第 一 至 第 三 范式 ， 其 他 的 范式 会 在 附录 B 中 介绍 。 









含有 多 值 
属性 的 表 






---------- 消除 多 值 属性 










消除 部 分 依赖 


消除 传递 依赖 












消除 余下 的 函 
数 依赖 所 导 敏 
的 异常 







BCNF 范 式 


---------- 消除 多 值 依赖 


第 四 范式 


图 5-22 规范 化 的 步骤 









消除 余下 的 
异常 
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5.6.2 函数 依赖 和 键 

规范 化 基于 对 图 数 依 赖 的 分 析 。 函 数 依赖 〈functional dependency) 是 存在 于 两 个 属性 或 
两 个 属性 集 之 间 的 约束 。 对 任意 关系 RR， 当 以 下 条 件 成 立时 ， 我 们 称 属性 B 函 数 依赖 于 属性 A: 
对 于 任意 有 效 的 A 的 实例 ， 它 的 值 惟一 决定 属性 B 的 值 (Dutka and Hanson，1989)。B 对 于 A 的 
函数 依赖 可 以 用 箭头 表示 如 下 : A 一 B。 一 个 属性 可 以 函数 依赖 于 两 个 (或 更 多 ) 的 属性 ， 而 
不 局 限于 单个 属性 。 例 如 ， 考 虑 图 $-7 中 的 关系 EMP_COURSE (Emp_ID, Course_Title, 
Date_Completed ) ， 我 们 将 关系 中 的 国 数 依赖 表示 如 下 : 


Emp_ID，Course_Title~Date_Completed 

上 F 面 的 函数 依赖 表明 ， 一 个 课程 的 结束 日 期 完全 取决 于 员工 的 ID 和 课程 的 名 称 。 下 面 列 出 
其 他 一 些 图 数 依赖 的 例子 : 

1) SSN 一 Name，Address ，Birthdate 一 个 人 的 社会 安全 号 完全 决定 他 的 名 字 、 地 址 和 生日 。 

2) YIN~Make，Modeli，Color 车 辆 的 制造 商 、 型 号 和 颜色 是 由 车 辆 的 标识 代码 决定 的 。 

3) ISBN 一 Title ，First_Author_Name 书 名 和 第 一 作者 名 是 由 书 的 国际 标准 书号 所 决定 的 。 

决定 因子 在 函数 依赖 中 ,箭头 左 方 的 属性 称 为 决定 因子 (determinant)。 在 上 面 的 例子 中 ， 
SSN，VIN 和 1ISBN 都 是 决定 因子 。 在 图 $-7 的 关系 EMP_COURSE 里 ，Emp_ID 和 Course_Title 组 
合 起 来 就 是 决定 因子 。 

候选 键 ”一 个 候选 键 (candidate key) 是 可 以 惟一 标识 关系 中 某 一 行 的 属性 或 属性 集 。 候 
选 键 必须 满足 以 下 性 质 (Dutka and Hanson，1989)， 这 是 前 面 所 列举 的 主键 6 个 性 质 的 一 部 分 : 

1) 惟一 标识 “” 键 值 必须 惟一 标识 关系 中 的 每 一 行 。 这 总 味 着 任何 非 键 属性 都 函数 依赖 于 该 
键 。 

2) 非 元 余 从 键 中 删除 任意 属性 ， 都 不 会 破坏 键 的 惟一 标识 的 性 质 。 

使 用 这 个 定义 ,我 们 在 本 章 中 所 提 到 的 两 个 关系 里 寻找 候选 键 。 关 系 EMPLOYEE1 (参见 
图 5-1) 的 模式 为 BMPLOYEE1 (Emp_ID，Name， Dept_Name，Salary)。Emp_ID 是 关系 中 惟 
一 的 决定 因子 ， 所 有 其 他 属性 都 函数 依赖 于 Emp_ID。 所 以 Emp_ID 是 候选 键 ， 同时 也 是 主键 
(因为 没有 其 他 候选 键 )。 

我 们 使 用 图 5-23 中 的 符号 来 表示 关系 的 函数 依赖 , 图 5-23a 中 给 出 关系 EMPLOYEE1 的 表示 。 
图 中 的 横 线 描述 函数 依赖 ， 从 主键 (Emp_ID ) 到 这 条 横 线 有 一 条 竖 线 。 竖 线 上 的 箭头 指向 这 
些 函 数 依赖 于 主键 的 非 键 属性 。 

再 考查 关系 EMPLOYEE2 (参见 图 5-2b)。 注 意 ，Emp_ID 并 不 能 惟 -标识 关系 中 的 行 (不 
同 于 EMPLOYEE1)。 比 如 表 中 有 两 行 的 Emp_ID 都 是 100。 在 这 个 关系 中 有 两 个 函数 依赖 : 

1) Emp_ID— Name, Dept_Name, Salary 

2) Emp_ID, Course_Title~ Date_Completed 

由 此 可 知 ，Emp_ID 和 Course_Title 的 组 合 是 关系 EMPLOYEE2 的 惟一 候选 键 (主键 )。 换 言 
之 ， 这 个 关系 的 主键 是 一 个 复合 键 。 Emp_ID 或 是 Course_Title 都 不 能 单独 标识 关系 中 的 一 行 ， 
根据 上 面 的 性 质 1， 它 们 都 不 能 单独 作为 候选 键 。 读者 可 以 查看 图 5-2b 中 的 数据 以 确认 Emp_ID 
和 Course_Title 的 组 合 确实 可 以 标识 关系 中 的 每 一 行 。 我 们 在 图 5-23b 中 表示 这 个 关系 里 的 函数 
依赖 ， 可 以 看 到 Date_Completed 是 惟一 函数 依赖 于 由 Emp_ID 和 Course_Title 组 成 的 主键 的 属性 。 

我 们 可 以 归纳 决定 因子 和 候选 键 之 间 的 联系 如 下 。 一 个 候选 键 一 定 是 决定 因子 ， 而 决定 因 
子 不 一 定 是 候选 键 。 例 如 ， 在 关系 EMPLOYEE2 中 ，Emp_ID 是 决定 因子 ， 但 它 不 是 候选 键 。 
一 个 候选 键 是 一 个 可 以 标识 关系 中 所 有 其 他 ( 非 键 ) 属性 的 决定 因子 。 一 个 决定 因子 可 以 是 候 
选 键 (比如 EMPLOYEE1 中 的 Emp_ID )， 是 复合 候选 键 的 一 部 分 (如 EMPLOYEE2 中 的 
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Emp_ID )， 或 者 是 非 键 属性 。 我 们 在 后 面 会 给 出 这 种 情况 的 例子 。 


EMPLOYEE1 


Emp_ID Name ] Dept_Name | sa | 


al EMPLOYEET 中 的 的 数 依赖 











EMPLOYEE2 


Course_Title Name | pept Name Salary Date_Completed 


b) EMPLOYEE2 引 的 图 数 依赖 
图 5-23 霄 数 依赖 的 表示 














5.7 基本 范式 


住 讨 论 过 函数 依赖 和 键 后 ， 下 面 进一步 介绍 第 一 到 第 三 范式 。 我 们 同时 描述 信息 库 中 概要 
数据 的 规范 化 问题 。 
5.7.1 第 一 范式 

一 个 不 含 多 值 属性 的 关系 符合 第 一 范式 ( First Normal Form，1NF)。 关 系 的 第 一 个 性 质 就 
要 求 行 和 列 的 交叉 处 必须 为 原子 值 ， 所 以 包含 多 值 属性 或 重复 组 的 表 不 是 关系 。 

在 前 面 小 节 中 讨论 如 何 将 E-R 模 型 映射 为 关系 时 ， 已 经 介绍 了 去 除 E-R 模 型 的 实体 类 型 中 
多 值 属性 的 过 程 。 所 以 ， 如 果 用 户 利 用 将 E-R 模 型 转化 为 关系 的 方法 进行 逻辑 设计 ， 那 么 得 到 
的 结果 中 应 该 不 含 多 值 属 性 。 然 而 一 些 老 的 遗留 系统 ， 比 如 -一些 以 COBOL 语 言 编写 的 系统 是 
支持 多 值 属性 的 。 由 于 读者 可 能 会 参与 将 这 些 系 统 转化 为 关系 数据 库 的 工作 ， 因 而 了 解 如 何 去 
除 多 值 属性 仍 是 非常 重要 的 。 

在 前 面 我 们 消除 图 5-2a 中 的 重复 组 ， 将 其 转化 为 图 5-2b 中 的 关系 EMPLOYEE2， 此 时 
EMPLOYEE2 是 满足 第 一 范式 的 。 在 这 个 过 程 中 ， 只 需要 将 每 列 中 由 于 多 值 属 性 而 留 空 的 单元 
用 相应 的 值 填 上 即 可 。 

5.7.2 第 二 范式 

如 果 一 个 关系 满足 第 ~ 范式 ， 且 任意 非 键 属性 都 完全 函数 依赖 于 主键 ， 那 么 这 个 关系 符合 
第 二 范式 (Second Normal Form，2NF)。 也 就 是 说 没有 非 键 属性 函数 依赖 于 部 分 (不 是 全 部 ) 
主键 。 当 一 个 符合 第 一 范式 的 关系 进一步 满足 以 下 任 一 条 件 时 就 符合 第 二 范式 : 

]) 主键 只 包含 一 个 属性 (如 关系 EMPLOYEE1 的 属性 Emp_ID )。 

2) 关系 中 不 含 非 键 属性 (关系 中 所 有 的 属性 都 是 主键 的 组 成 部 分 )。 

3) 每 一 个 非 键 属性 都 函数 依赖 于 整个 主键 属性 集 。 

EMPLOYEE2 (参见 图 5-2b) 是 一 个 不 满足 第 二 范式 的 关系 。 关 系 的 主键 是 由 Emp_ID 和 
Course_Title 组 合 而 成 的 ， ,然而 非 键 属性 Name、 Dept_Name 和 Salary 都 前 数 依赖 于 主键 的 部 分 
属性 (Emp_ID)， 而 不 函数 依赖 于 Course_Title。 这 些 依 赖 在 图 5-23b 中 表示 。 
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部 分 函数 依赖 (partial functional dependency ) 是 这 样 的 一 个 函数 依赖 ， 关 系 中 的 一 个 或 多 
个 非 键 属性 (如 Name) 函数 依赖 于 部 分 (而 不 是 全 部 ) 主键 。 关 系 EMPLOYEE2 中 的 部 分 函 
数 依赖 导致 关系 中 存在 数据 元 余 ， 但 当 用 户 对 表 进 行 修改 时 ， 就 会 产生 异常 。 

为 使 关系 满足 第 二 范式 ， 我 们 将 其 分 解 为 满足 上 面 一 个 (或 多 个 ) 条 件 的 新 关系 。 
EMPLOYEE2 被 分 解 为 下 面 的 两 个 关系 : 

1) EMPLOYEE1 (Emp iD，Name，Dept_Name，Salary) 这 个 关系 满足 条 件 1， 因 而 符合 
第 二 范式 (示例 数据 显示 在 图 5-1 中 )。 

2) EMP_COURSE(Emp_ID，Course_Title ，Date_Completed) 这 个 关系 满足 条 件 3， 因 而 符 
合 第 二 范式 (示例 数据 在 图 5-7 中 ) 。 

读者 可 以 验证 这 些 新 关系 已 经 不 存在 原来 EMPLOYEE2 中 的 异常 情况 。 

5.7.3 第 三 范式 

如 果 关 系 满足 第 二 范式 ， 且 不 含 传递 依赖 ， 则 该 关系 满足 第 三 范式 (Third Normal Form， 
3NF)。 关 系 中 的 传递 依赖 (transitive dependency) 是 在 两 个 (或 多 个 ) 非 键 属性 间 的 函数 依 
赖 。 如 在 下 面 的 例子 中 : 

SALES (Cust_ID, Name, Salesperson, Region) (示例 数据 在 图 $-24a 中 ) 


SALES 











Region 





Cust_ID Name Salesperson 


8023 Anderson Smith South 
9167 Bancroft Hicks West 
7924 Hobbs Smith South 
6837 Tucker Hernandez East 

8596 Eckersiey Hicks West 
7018 Arnold Faulb North 





















a) 关系 SALES 的 示例 数据 








b) SALES 内 的 传递 依赖 


图 5-24 含有 传递 依赖 的 关系 


图 5-24b 表 示 关 系 SALES 内 的 函数 依赖 。Cust_ID 为 关系 的 主键 ， 其 他 的 属性 都 函数 依赖 于 
它 。 但 是 在 关系 内 还 存在 着 一 个 传递 依赖 ( Region 消 数 依赖 于 Salesperson，Salesperson 函 数 依 
赖 于 Cust_ID )， 这 会 导致 以 下 的 更 新 异常 : 

1) 插入 异常 ”一 个 新 的 分 配 到 北 区 的 推销 员 (Robinson) 不 能 被 输入 表格 ， 直到 给 他 指定 
某 个 顾客 为 止 (因为 向 表 中 插入 一 行 时 必须 为 Cust_ID 提 供 值 )。 

2) 删除 异常 如 果 顾 客 6837 被 删除 ， 就 会 失去 在 东区 工作 的 推销 员 Hemandez 的 信息 。 

3) 修改 异常 ”如果 推销 员 Smith 被 重新 分 配 到 东区 ， 需要 修改 表 中 的 多 行 信息 以 反映 这 个 
变化 (在 图 5-24a 中 有 两 行 )。 

这 些 异 常 是 由 于 传递 依赖 所 引起 的 。 通过 将 关系 SALES 分 解 为 图 5-25a 中 的 新 关系 就 可 以 
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消除 传递 依赖 。 可 以 看 到 ，SALES 里 传递 依赖 的 决定 因子 SalespersonS 成 为 新 关系 SPERSON 
的 主键 ， 同 时 是 SALES1 的 外 键 。 通 常情 况 下 ， 图 5$-25 中 的 规范 化 的 关系 在 实现 时 用 到 的 存储 
空间 比 图 5-24a 中 所 示 关 系 所 用 的 存储 空间 少 。 这 是 由 于 那些 依赖 数据 (Region 和 其 他 
Salesperson 的 数据 ) 不 再 需要 重复 出 现 。 由 此 可 见 ， 规范化 在 消除 异常 的 同时 ， 也 可 以 减少 元 
余 的 数据 存储 。 














SALES1 SPERSON 

Cust_ID Name 、 Salesperson Region 
8023 Anderson Smith Smith South 
9167 Bancroft Hicks Hicks West 
7924 Hobbs Smith Hernandez East 
6837 Tucker Hernandez Faulb North 
8596 Eckersley Hicks 
7018 Arnold Faulb 

a) 分 解 SALES 关 系 
SPERSON 


SALES1 


Cust_ID 








b) 满足 3NF 的 关系 
图 5-25 消除 传递 依赖 


如 图 $-25b 所 示 ， 消 除 传递 依赖 后 的 新 关系 现在 满足 第 三 范式 。 读者 可 以 验证 原来 SALES 
中 的 异常 现在 在 SALES1 和 SPERSON 中 已 经 不 存在 了 。 

传递 依赖 也 可 能 在 关系 的 属性 集 之 间 出 现 。 比 如 ， 关系 SHIPMENT(Snum ，Origin ， 
Destination ，Distance) 记 录 着 运 货 的 信息 ， 包括 起 点 、 目 的 地 和 距离 等 信息 (Dutka and 
Hanson，1989)。 图 5-26a 显 示 了 这 个 关系 的 示例 数据 。 图 5-26b 显 示 出 关系 SHIPMENT 所 包含 
的 明 数 依赖 。SHIPMENT 关 系 中 的 主键 是 属性 Snum (货号 )， 由 此 可 知 它 满足 第 二 范式 (读者 
自行 考虑 原因 )。 然 而 在 关系 中 存在 着 一 个 传递 依赖 : 属性 Distance 函 数 依赖 于 一 对 非 键 属性 
Origin 和 Destination， 因 此 在 SHIPMENT 中 存在 着 异常 (作为 练习 ， 读 者 可 以 自行 考虑 5-26a 来 
列举 出 插入 异常 、 删 除 异 常 和 修改 异常 的 例子 )。 我 们 可 以 通过 将 SHIPMENT 分 解 为 以 下 的 两 
个 关系 (都 满足 3NE) 来 消除 传递 依赖 ; 


DISTANCES (OQrigin. Destination, Distance) 
第 一 个 关系 分 别 说 明 某 次 运 货 的 起 点 和 目的 地 ， 第 二 个 关系 说 明 起 点 和 目的 地 之 间 的 距离 ， 
其 示例 数据 在 图 5-26c 中 显示 。 


9S 南下 Salesperson 是 -个 智能 业务 键 ， 所 以 并 不 适合 作为 主键 。 在 第 3 章 中 我 们 对 此 进行 过 简要 说 明 ， 在 本 章 
稍 后 会 给 予 详细 的 讨论 。 





第 5 草 ”到 帮 红 据 伴 伐 计 和 关 夭 模型 ”177 


















SHIPMENT 
Origin Destination Distance 
Seattle Denver 
Chicago Dallas 1,058 
Boston Atlanta 1,214 
Denver Los Angeles 1,150 
Minneapolis St. Louis 








a) 关系 SHIPMENT 及 其 示例 数据 


SHIPMENT | | 加 


Snum Origin Destination _ Distance 


,| | 


bj SHIPMENT 中 的 因数 依赖 














SHIPTO DISTANCES 


Snum Origin Destination Origin Destination Distance 





Seattle Denver Seattle Denver 1,537 
Chicago Dallas Chicago Dallas 1,058 


Boston Atlanta Boston Atlanta 1,214 


Denver Los Angeles Denver Los Angeles 1,150 


Minneapolis St. Louis Minneapolis St. Louis 587 





c) 满足 3NF 的 关系 
图 5-26 另 一 个 传递 依赖 的 例子 


5.7.4 规范 化 概要 数据 

组 织 中 支持 制定 管理 决策 的 数据 库 系统 中 ， 通 常 包含 运作 型 数据 库 中 数据 的 一 个 子 集 或 是 
概要 数据 。 这 些 用 于 更 高 层次 管理 需求 的 “数据 仓库 ”通常 也 需要 进行 规范 化 ( 至 少 规范 化 到 
某 种 程度 ) 以 避免 运作 型 数据 库 中 出 现 类 似 的 异常 问题 。 我 们 在 第 11 章 中 介绍 有 关 数据 仓库 的 
数据 规范 化 问题 。 


5.8 合并 关系 


在 前 面 的 小 节 中 ， 我 们 讨论 如 何 将 E-R 模 型 转化 为 关系 模型 ， 然 后 介绍 如 何 检查 转化 后 年 
成 的 关系 ， 判 定 其 是 否 符合 第 三 范式 ， 并 在 需要 的 情况 下 对 其 进行 规范 化 。 

作为 多 辑 设计 过 程 的 一 部 分 ， 规 范 化 的 关系 可 能 由 多 个 独立 的 E-R 模 型 生成 ， 也 可 能 源 自 
其 他 的 用 户 视图 ， 所 以 其 中 一 些 关系 可 能 是 元 余 的 ， 即 对 应 相同 的 实体 。 在 这 种 情况 下 ， 我 们 
需要 合并 这 些 关系 以 消除 宛 余 。 本 节 讨 论 的 内 容 是 合并 关系 (又 称 为 视图 集成 )， 了 解 关系 合 
并 的 方法 有 以 下 三 个 重要 的 原因 : 
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1) 在 大 型 项 目 中 ， 多 个 小 组 同时 参与 逻辑 设计 ， 所 以 有 合并 关系 的 要 求 。 

2) 将 已 有 的 数据 库 系统 与 新 的 信息 要 求 相 结合 时 ， 往 往 需要 集成 多 个 不 同 的 视图 。 

3) 在 开发 的 生命 周期 中 ， 可 能 产生 新 的 数据 需求 ， 因 此 应 该 将 新 生成 的 关系 与 已 有 的 关系 
合并 。 

5.8.1 例子 

假设 对 一 个 用 户 视图 建 模 后 产生 以 下 的 3NF 关 系 : 

EMPLOYEE] (Employee, ID. Name, Address. Phone) 

对 第 二 个 用 户 视图 建 模 后 产生 以 下 的 关系 : 

EMPLOYEE2 (Employee_ID, Name, Address. Jobcode. No Years) 

考虑 到 这 两 个 关系 有 相同 的 主键 (Employee_ID)， 它 们 可 能 描述 的 是 同一 个 实体 ， 因 而 应 
该 合并 为 一 个 关系 。 合 并 后 得 到 的 关系 是 : 

EMPLOYEE (Employee_ID., Name, Address, Phone. Jobcode, No _Years ) 

注意 ， 在 合并 后 的 关系 中 ， 前 面 两 个 关系 共有 的 属性 (如 Name) 都 只 出 现 一 次 。 

5.8.2 视图 集成 产生 的 问题 

在 进行 前 面 所 述 的 关系 集成 时 ， 数 据 库 分析 人 员 必 须 了 解数 据 的 含义 ， 并 准备 解决 在 这 一 
过 程 中 可 能 产生 的 问题 。 在 本 节 ， 我 们 简要 分 析 一 下 在 视图 集成 中 可 能 发 生 的 4 个 问题 : 同 义 
词 、 异 义 、 传 递 依赖 和 超 类 型 / 子 类 型 联系 。 

同义词 在 某 些 情况 下 ， 两 个 (或 多 个 ) 属性 名 字 不 同 ， 但 是 含义 相同 ， 因 为 它们 描述 的 
是 一 个 实体 的 同一 个 特征 。 这 样 的 属性 称 为 同义词 (synonyms)。 比 如 ，Employee_ID 和 
Employee_No 就 可 能 是 同义词 。 当 合并 含有 同义词 的 关系 时 ， 应 该 (如 果 可 能 的 话 ) 和 用 户 在 
命名 上 达成 共识 ， 使 用 标准 的 命名 并 去 除 其 他 同义词 ( 另 一 种 办 法 是 使 用 其 他 的 名 字 来 殖 代 所 
有 同义词 )。 例 如 ， 考 虑 下 面 的 关系 : 

STUDENT1(Rtudent_ID，Name ) 

STUDENT2 (Matriculation_No, Name, Address) 

在 这 种 情况 下 ， 分 析 员 可 能 会 发 现 Student_ ID 和 Matriculation_No 都 是 个 人 的 社会 安全 号 ， 
因而 是 相同 的 属性 〈 另 一 种 可 能 性 是 它们 都 是 候选 键 ， 但 是 只 有 一 个 能 选 为 主键 )。 一 个 可 行 
的 解决 办 法 是 将 两 个 属性 名 称 改 为 标准 名 称 ， 比 如 都 叫做 Student_ID ， 或 者 使 用 一 个 新 的 属性 
名 (比如 SSN) 代替 这 两 个 同义词 。 假 设 使 用 后 一 种 方法 ， 合 并 两 个 关系 后 得 到 新 关系 : 


STUDENT (SSN, Name, Address) 


在 出 现 同义词 的 情况 下 ， 用 户 往往 希望 使 用 不 同 的 名 字 来 访问 同一 个 数据 。 这 样 他 们 可 以 
使 用 熟悉 的 名 称 ， 并 与 他 们 的 部 门 所 使 用 的 术语 保持 一 致 别名 (alias) 是 属性 的 其 他 的 名 字 。 
很 多 数据 库 管 理 系统 支持 定义 别名 ， 它 们 可 以 与 属性 的 主 名 字 互 换 使 用 。 

异 义 一 个 可 以 有 多 种 含义 的 属性 称 为 异 义 (homonyms)。 比 如 ， 术 语 “account” 可 以 指 银 
行 的 支票 账户 、 储 著 账 户 、 贷 款 账 户 ,或 者 其 他 类 型 的 账户 (这样 依据 用 途 的 不 同 ，“account” 
可 以 代表 不 同 的 数据 )。 

在 合并 关系 上 时， 必须 注意 异 义 的 情况 。 考 虑 下 面 的 例子 : 

STUDENT1 (Student ID, Name, Address) 

STUDENT2 (Student_ID, Name, Phone No, Address) 


在 与 用 户 讨论 后 ， 分 析 人 员 发 现 ， 在 关系 STUDENT1 中 属性 Address 是 指 学 生 的 校内 地 址 ， 
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而 在 关系 STUDENT2 中 Address 属 性 是 指 学 生 的 永久 (家庭 ) 地址。 为 解决 这 个 矛盾 ， 就 需要 
疹 加 新 的 属性 ， 所 以 合并 后 的 关系 为 : 

STUDENT (Student._1D, Name, Phone No. Campus_ Address. Permanent Address) 

传递 依赖 ” 当 两 个 符合 第 二 范式 的 关系 合并 成 一 个 关系 时 ， 就 可 能 产生 传递 依赖 (本章 的 
前 面 介绍 过 传递 依赖 的 概念 )。 比 如 ， 考 虑 下 面 的 两 个 关系 : 

STUDENT]1 (Student _ID., Major) 

STUDENT2 (Student_ID, Advisor) 


由 于 STUDENT1 和 STUDENT2 有 相同 的 主键 ， 所 以 两 个 关系 可 以 合并 为 : 

STUDENT (Student._ID, Major, Advisor) 

但 是 如 果 每 一 门 专业 只 有 一 位 指导 教师 ， 此 时 指导 教师 就 函数 依赖 于 专业 : 

Major -Advisor 

如 果 存 在 上 面 的 函数 依赖 、 则 合并 后 的 关系 STUDENT 满 足 第 二 范式 ， 但 不 满足 第 三 范式 ， 
内 为 它 包 含 一 个 传递 依赖 。 分 析 人 员 可 以 通过 消除 传递 依赖 来 创建 满足 第 三 范式 的 关系 
(Major 成 为 STUDENT 的 外 键 ): 

STUDENT (Student_ID. Major) 

MAJOR ADVISOR(Majior. Advisor) 

超 类 型 / 子 类 型 联系 这 些 联系 可 能 隐藏 在 用 户 视图 或 关系 中 。 假 设 我 们 有 以 下 两 个 关于 
医院 的 关系 : 

PATIENT1(Patient_ ID，Name、Address ) 

PATIENT2 (Patient ID， Room No) 


初 看 起 来 ， 这 两 个 关系 可 以 被 合并 为 一 个 PATIENT 关系 。 但 是 ， 分 析 人 员 注意 到 有 两 种 类 
型 的 病人 : 住院 病人 和 门诊 病人 。 关 系 PATIENT1 事 实 上 包含 所 有 病人 共有 的 属性 ， 而 
PATIENT2 的 属性 (Room_No) 是 住院 病人 所 独 有 的 特征 。 在 这 种 情况 下 ， 分 析 人 员 会 为 这 些 
实体 生成 超 类 型 / 子 类 型 联系 : 


PATIENT(Patient_ID, Name, Address ) 
RESIDENT PATIFENT( Patient ID， Room_No) 


OUTPATIENT (Patient TID， Date Treated) 


要 进一步 地 了 解 有 关 数 据 库 设 计 中 视图 集成 的 问题 ， 可 以 参阅 Navathe、Elmasri 和 Larson 
的 著作 (1986)。 


5.9 定义 关系 键 的 最 后 步骤 


在 第 3 章 中 ， 我 们 提供 了 一 些 选 择 标识 首 的 准则 : 标识 符 的 值 不 随时 间 变化 ， 必 须 是 惟 -- 
的 和 已 知 的 ， 非 智能 的 ， 为 复合 标识 符 使 用 一 个 属性 代理 。 实 际 上 所 有 这 些 准则 在 数据 库 实现 
(标识 符 成 为 主键 ， 并 被 定义 为 物理 数据 库 的 一 个 字段 ) 以 前 都 不 一 定 要 满足 。 但 在 关系 被 定 
义 为 数据 库 的 表 之 前 ， 如 果 需 要 的 话 ， 应 该 对 关系 的 主键 作 适 当 修 改 以 满足 这 些 准则 . 

最 近 ， 数 据 库 专家 (Johnston 2000) 强调 作为 主键 的 规范 准则 。 专 家 目前 建议 ， 主 键 在 整 
个 数据 库 范 围 内 是 惟一 的 〈 称 为 企业 键 ，enterprise key ) ， 而 不 单单 在 它 所 在 的 关系 表 中 惟一 
这 个 准则 使 得 主键 更 类 似 于 面向 对 象 数据 库 系统 中 的 对 象 标识 符 (参见 第 14、15 章 )。 根 据 这 
种 建议 ， 关 系 的 主键 就 成 为 数据 库 系统 的 内 部 值 ， 而 不 再 具有 任何 业务 含义 。 
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一 个 候选 主键 (如 图 5-1 的 关系 EMPLOYEE1 中 的 Emp_ID 以 及 图 5-25 里 关系 SPERSON 中 的 
Salesperson) 只 要 曾经 在 组 织 内 部 使 用 过 ， 就 称 为 “业务 键 "， 并 可 以 在 关系 中 作为 非 键 属 性 。 
关系 EMPLOYEE1 和 SPERSON (以 及 数据 库 内 的 任何 其 他 关系 ) 都 会 被 赋予 一 个 新 的 企业 键 
属性 (例如 叫做 Object_ID)， 该 属性 不 具有 任何 业务 含义 。 

为 什么 要 添加 这 个 额外 的 属性 呢 ” 使 用 企业 键 的 一 个 重要 原因 是 考虑 到 数据 库 的 可 演化 
性 ， 即 在 数据 库 创建 以 后 会 再 合并 进 新 的 关系 。 例 如 ， 考 虑 下 面 的 两 个 关系 : 

EMPLOYEE (Emp_ID, Emp Name. Dept Name. Salary) 

CUSTOMER (Cust_ID, Cust Name, Address) 


在 这 个 例子 中 没有 企业 键 ，Emp_ID 和 Cust_ID 无 论 是 否 具有 智能 特性 ， 部 不 -一定 具 有 相同 
的 格式 、 长 度 和 数据 类 型 。 假 如 这 个 组 织 提 升 了 其 信息 系统 的 处 理 需 求 ， 并 意识 到 员工 也 可 能 
成 为 顾客 ， 那 可 以 将 员工 和 顾客 都 作为 新 类 型 PERSON 的 子 类 型 。 此 时 ， 系 统 会 有 如 下 的 二 个 
关系 : 

PERSON (Person_ID、Person Name) 


EMPLOYEE (Person_1ID, Dept Name, Salary) 
CUSTOMER (Person_ID., Address) 


此 时 ， 在 数据 库 中 的 各 个 地 方 ， 同 一 个 人 的 Person_ID 都 有 同样 的 值 。 但 是 如 果 在 
PERSON 关 系 建立 以 前 ， 就 已 经 为 Cust_ID 和 Emp_ID 选 定 值 ， 那 么 显然 不 能 够 保证 这 两 个 值 是 
一 致 的 。 此 外 ， 如 果 我 们 修改 Cust ID 和 Emp_ID 的 值 ， 去 匹配 新 的 Person_ID ， 那 又 如 何 确保 
所 有 已 有 的 Cust_ID 和 Emp_ID 会 和 那些 已 经 关联 Person_ID 的 employee 或 customer 取 值 不 同 呢 ? 
更 糟糕 的 是 ， 如 果 有 其 他 的 表 ， 比 方 说 和 EMPLOYEE 关 联 ， 则 还 必须 修改 这 些 表 中 的 外 键 ， 
从 而 造成 连锁 反应 。 保 证 关系 的 主键 在 整个 数据 库 中 惟一 的 办 法 是 在 一 开始 就 为 关系 建立 企业 
键 ， 这 样 就 永远 不 需要 修改 主键 。 

在 我 们 的 例子 中 ， 带 有 企业 键 的 初始 数据 库 (不 包括 PERSON ) 的 情况 如 图 5-27 所 示 ( 包 
括 5-27a (关系 ) 和 5-27b (示例 数据 ))。 在 图 中 ， Emp_ID 和 Cust_ID 现 在 是 业务 键 ， 而 
OBJECT 是 所 有 其 他 关系 的 超 类 型 。OBJECT 可 以 有 属性 ， 比 如 对 象 的 类 型 名 (在 例子 中 为 属 
性 Object_Type)， 创 建 日 期 ， 最 近 修改 日 期 和 其 他 对 象 实例 应 有 的 系统 内 部 属性 。 当 需要 创建 
新 的 关系 PERSON 时 ， 数 据 库 演化 为 图 5-27c (关系 ) 和 图 5-27d (实例 数据 ) 所 示 的 样子 。 演 
化 成 包含 PERSON 的 数据 库 仍然 需要 对 于 原 有 数据 库 进 行 某 些 修改 ， 但 不 必修 改 主键 的 值 . 
Name 属 性 被 移动 到 PERSON ， 因 为 将 子 类 型 和 外 键 添加 到 EMPLOYEE 和 CUSTOMER 以 指向 同 
一 个 Person 的 实例 是 很 常见 的 。 在 后 面 的 第 7 章 中 读者 会 了 解 到 ， 给 表 的 定义 增加 或 删除 非 键 
的 列 ， 其 至 是 外 键 ， 都 是 容易 的 。 相 反 ， 大 多 数 数据 库 管理 系统 都 不 容许 改变 关系 的 主键 ， 因 
为 引起 的 外 键 的 连锁 反应 代价 很 大 。 


本 章 小 结 


逻辑 数据 库 设 计 是 将 概念 数据 模型 转化 为 逻辑 数据 模型 的 过 程 。 由 于 关系 模型 在 现代 数据 
库 系统 中 的 主流 地 位 ， 所 以 也 成 为 本 童 的 重点 。 关 系数 据 模型 以 称 为 关系 的 表 的 形式 来 表示 数 
据 ， 一 个 关系 是 已 命名 的 二 维 数据 表 。 关 系 的 一 个 重要 性 质 是 它 不 能 包含 多 值 属性 。 

在 本 章 中 ， 我 们 介绍 了 逻辑 数据 库 设计 过 程 的 主要 步 又 ， 它 基于 E-R 图 到 规范 化 关系 的 转 
化 。 这 个 过 程 的 三 个 步 又 是 : 将 E-R (EER) 图 转化 为 关系 ， 规 范 化 关系 和 合并 关系 。 这 个 过 
程 的 结果 是 一 组 符合 第 三 范式 的 关系 ， 它 们 可 以 使 用 任何 现代 的 关系 数据 库 管理 系统 来 实现 。 
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E-R 图 中 的 每 一 个 实体 类 型 都 可 以 转化 为 一 个 和 它 有 相同 主键 的 关系 。 人 在 表示 一 对 多 联系 
时， 给 对 应 联系 M 一 方 实体 的 关系 添加 外 键 ( 它 引用 联系 另 一 方 所 对 应 关系 的 主键 )。 通 过 增 
加 一 个 新 的 关系 来 表示 多 对 多 的 联系 ， 这 个 关系 的 主键 是 个 复合 键 ， 由 参与 联系 的 各 个 实体 主 
键 构成 。 





OBJECT (OID, Obiect_Type) 


EMPLOYEE (OID, Emp_ID, Emp_Name, Dept_Name, Salary) 
CUSTOMER (OID, Cust_ID, Cust_Name, Address) 





a 带 存 企业 键 的 关系 
OBJECT 
Object_Type 


EMPLOYEE 
CUSTOMER 
CUSTOMER 
EMPLOYEE 
EMPLOYEE 
CUSTOMER 
CUSTOMER 


















50000 
45000 
45000 



















Hopkins, Dan 
Huber, Ike 


Purchasing 
Accounting 


Fred's Warehouse | Greensboro, NC 

















Bargain Bonanza Moscow, ID 
Jasper's Tallahassee, FL 
Desks 'R Us Kettering, OH 






b) 企业 键 的 示例 数据 


OBJECT (OID, Object_Type) 
EMPLOYEE (OID, Emp_ID, Dept_Name, Salary, Person_ID) 


CUSTOMER (QID, Cust_ID, Address, Person _ID) 
PERSON (OID, Name) 








c) 增加 关系 PERSON 后 的 关系 集 
图 5-27 企业 键 
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OBJECT PERSON 
Object_Type OID | Name 








EMPLOYEE Jennings, Fred 
CUSTOMER Fred's Warehouse 
CUSTOMER Bargain Bonanza 
EMPLOYEE Hopkins, Dan 
EMPLOYEE Huber, Ike 
CUSTOMER jasper's 
CUSTOMER Desks 'R Us 
PERSON 

PERSON 

PERSON 

PERSON 

PERSON 

PERSON 

PERSON 


DVD 一 


Person_ID 





Marketing 
Purchasing 
Accounting 


Address 





Greensboro, NC 
Moscow, ID 
Tallahassee, FL 
Kettering, OH 





d) 增加 关系 PERSON 后 的 示例 数据 
图 5-27 ( 续 ) 


关系 模型 不 直接 支持 超 类 型 / 子 类 型 联系 ， 但 是 我 们 可 以 通过 为 超 类 型 和 每 个 子 类 型 创建 
单独 的 表 (关系 ) 来 为 这 种 联系 建 模 。 每 个 子 类 型 的 主键 都 应 该 与 超 类 型 的 主键 相同 (或 至 少 
属于 相同 的 域 )。 超 类 型 必须 拥有 一 个 称 为 子 类 型 鉴别 符 的 属性 ， 并 使 用 它 来 区 分 每 个 超 类 型 
的 实例 属于 哪个 子 类 型 。 规 范 化 的 目的 是 导出 良 构 关系 ， 这 些 关系 在 修改 和 更 新 时 不 会 产生 异 
常 (不一致 或 错误 )。 规 范 化 基于 对 函数 依赖 的 分 析 ， 函 数 依 赖 是 两 个 属性 (或 两 个 属性 集 ) 
间 的 约束 。 规 范 化 有 儿 个 不 同 的 阶段 。 当 关系 满足 1NF 时 不 含 多 值 属性 或 重复 组 ， 满 足 2NF 时 
不 包含 部 分 依赖 ， 满 足 3NF 时 不 包含 传递 依赖 。 我 们 可 以 使 用 图 来 表示 关系 中 的 函数 依赖 ， 以 
帮助 我 们 在 需要 的 情况 下 将 关系 分 解 为 满足 3NF 的 形式 。 更 高 层次 的 范式 定义 (超出 3NF) 会 会 
在 附录 B 中 讨论 。 

在 合并 关系 的 时 候 ， 我 们 必须 注意 同义词 、 异 义 、 传递 依 奈 和 超 类 型 / 子 类 型 联系 等 站 是 。 
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此 外 ， 当 在 数据 库 管 理 系 统 中 定义 关系 之 前 ， 所 有 主键 应 该 被 定义 为 由 单一 属性 构成 的 非 智能 
键 ， 最 好 是 企业 键 。 























3. 比较 以 下 的 术语 。 
a. 范式 ; 规范 化 
c. 函数 依赖 ， 传 递 依赖 
e. 决定 因子 ; 候选 刍 


4. 总 结 关系 的 6 个 重要 性 质 。 


b. 候选 键 ; 主键 
d. 复 合 键 ; 递归 外 键 
f. 外 键 ; 主键 


5. 指出 候选 键 必 须 满足 的 两 个 性 质 。 
6. 描述 表 中 可 能 存在 的 3 种 异常 。 


7. 填空 


a. 一 个 不 含 部 分 函数 依赖 的 关系 满足 


范式 。 





本 章 复习 
关键 术语 
别名 异常 候选 键 
复合 键 决定 因子 企业 键 
实体 完整 性 规则 第 一 范式 外 键 
函数 依赖 异 义 范式 
规范 化 Null 部 分 函数 依赖 
主键 递归 外 键 参照 完整 性 约束 
关系 第 二 范式 同义词 
第 三 范式 传递 依赖 良 构 关系 
习 问 题 
1. 定义 以 下 的 术语 。 
a. 决定 因子 b. 函数 依赖 
c. 传递 依赖 d. 递归 外 键 
e. 规范 化 f. 复合 键 
g. 关系 h. 范式 
i. 部 分 函数 依赖 j. 企业 键 
2. 将 术语 和 它 的 定义 匹配 起 来 。 
良 构 关系 a. 两 个 属性 间 的 约束 
异常 b. 非 键 属性 间 的 函数 依赖 
-函数 依赖 c. 引用 同一 关系 中 的 主键 ” 
~ 决定 因子 d. 不 含 多 值 属 性 
复合 键 e. 不 一 致 或 错误 
INF f. 含有 少量 元 余 
2NF g. 包含 两 个 (更 多 ) 属性 
3NF h. 不 含有 部 分 函数 依赖 
-~ 递归 外 键 i. 不 含 传递 依赖 
~ 关系 j. 示 数 依赖 左 侧 的 属性 
-传递 依赖 k. 已 命名 的 二 维 数据 表 
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b. 一 个 不 含 多 值 属性 的 关系 满足 范式 。 

c, 一 个 不 含 传递 依赖 的 关系 满足 范式 。 
8. 什么 叫 良 构 关系 ?为 什么 良 构 关系 在 逻辑 数据 库 设 计 中 很 重要 ? 
9. 说 明 如 何 将 下 列 E-R 图 中 的 元 素 转化 为 关系 。 








a. 常规 实体 b. 联系 (1:M) 

c. 联 系 (M:N) d. 联系 〈 超 类 型 / 子 类 型 ) 
e. 多 值 属性 f. 弱 实 体 

8. 复合 属性 


10. 简要 描述 在 合并 关系 时 经 常 出 现 的 4 种 典型 问题 ， 并 说 明 解 决 这 些 问题 的 常用 方法 。 
11. 列举 判定 一 个 满足 第 一 范式 的 关系 也 满足 第 二 范式 的 3 个 条 件 。 
12. 说 明 如 何 用 SQL CREATE TABLE 命 令 指 定 以 下 的 完整 性 约束 : 
a. 实体 完整 性 b. 参照 完整 性 
13. 如 何在 关系 数据 模型 中 表示 实体 间 的 联系 ? 
14. 如 何在 关系 数据 模型 中 表示 一 个 一 元 的 1:M 联 系 ? 
15. 如 何在 关系 数据 模型 中 表示 一 个 三 元 的 M:N 联系 ? 
16. 关系 的 主键 和 这 个 关系 的 所 有 属性 间 的 函数 依赖 有 什么 联系 ? 
17. 什么 情况 下 外 键 不 能 取 null 值 ? 
18. 解释 如 何 定义 主键 ， 以 避免 在 数据 库 演化 时 可 能 导致 的 外 键 连锁 修改 ? 
问题 和 练习 

1. 利用 第 3 章 中 的 E-R 图 完成 下 列 练习 。 

I 将 图 转化 为 可 以 表示 参照 完整 性 约束 的 关系 模型 (如 图 5$-5 所 示 )。 

II. 对 于 每 一 个 关系 ， 用 图 表示 其 中 的 国 数 依赖 (如 图 5-23 所 示 )。 

II. 如 果 下 列 图 中 所 示 的 关系 不 满足 3NF， 将 它们 转化 为 满足 3NF 的 关系 。 


a. 图 3-8 b. 图 3-9b 

c. 图 3-11a d. 图 3-11b 
e. 图 3-15a (有 联系 的 版 本 ) f. 图 3-16 

g. 图 3-19 


2. 利用 第 4 章 中 的 EER 图 完成 下 列 练习 。 
1. 将 图 转化 为 可 以 表示 参照 完整 性 约束 的 关系 模型 (如 图 5-5 所 示 )。 
HL 对 于 每 一 个 关系 ， 用 图 表示 其 中 的 函数 依赖 (如 图 5-23 所 示 )。 
HL 如 果 下 列 图 中 所 示 的 关系 不 满足 3NF， 将 它们 转化 为 满足 3NF 的 情况 。 


a. 图 4-6b b. 图 4-7a 
c. 图 4-9 d. 图 4-10 
e. 图 4-18 


3. 指出 以 下 关系 所 满足 的 范式 。 如 果 关 系 不 满足 3NF， 则 将 其 分 解 为 满足 3NF 的 形式 。 国 
数 依赖 ( 除 主键 表示 的 以 外 ) 在 合适 的 地 方 给 出 。 
a. CLASS (Course_No, Section No) 
b. CLASS (Course_No, Section No, Room) 
Cc. CLASS (Course_No, Section_No, Room, Capacity ) Room 一 Capacity 
d. CLASS (Course No， Section_No, Course_Name, Room, Capacity ) 
Course_No— Course_Name, Room— Capacity 
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4. 图 5-28 中 是 Millennium 学 院 的 班级 列表 ， 使 用 企业 键 将 这 个 用 户 视图 转化 为 一 组 满足 
3NF 的 关系 。 我 们 作出 如 下 假设 : 

* 每 个 教师 有 惟一 的 办 公 地 点 。 

* 每 个 学 生 有 惟一 的 专业 。 

* 每 门 课程 有 惟一 的 名 字 。 





MILLENNIUM COLLEGE 
CLASS LIST 
FALL SEMESTER 200X 


COURSE NO.: |S 460 

COURSE TITLE: DATABASE 
INSTRUCTOR NAME: NORMA LL. FORM 
INSTRUCTOR LOCATION: B 104 


STUDENT NO. STUDENT NAME MAJOR GRADE 





38214 Bright IS A 
40875 Cortez CS B 
51893 Edwards IS A 





图 5-28 班级 列表 (Millennium 学 院 ) 


5. 图 5-29 是 一 个 简化 的 信用 卡 系 统 的 E-R 图 。 有 两 种 类 型 的 卡 账户 : 借 记 卡 和 信用 卡 。 信 
用 卡 将 每 次 消费 的 金额 累加 起 来 ， 每 次 消费 都 包括 消费 时 间 和 消费 的 金额 。 
a. 开发 一 个 关系 模型 (类 似 图 $-5 )。 
b. 表示 出 所 有 的 函数 依赖 (类 似 图 5-23 ) 。 
c. 使 用 企业 键 给 出 一 组 满足 3NF 的 关系 。 
6. 表 5-2 是 关于 供 货 商 和 他 们 供应 的 零件 的 示例 数据 。 通 过 对 用 户 的 调研 ， 我 们 发 现 零件 
号 (而 不 是 描述 ) 惟一 标识 零件 ， 而 供 货 商 的 名 称 惟 一 地 标识 供 货 商 。 
a. 将 这 个 表 转 化 为 满足 第 一 范式 的 关系 ( 名 称 为 PART SUPPLIER )， 使 用 表 中 的 示例 数 
据 来 说 明 这 个 关系 。 
b. 列 出 PART SUPPLIER 中 的 函数 依赖 ， 并 指出 其 中 的 候选 键 。 
c. 对 于 关系 PART SUPPLIER ， 分 别 找 出 如 下 异常 : 插入 异常 、 删 除 异常 和 修改 异常 。 
d. 为 关系 PART SUPPLIER 面 出 关系 模型 图 (类 似 图 $-23)， 并 表示 出 函数 依赖 。 
e. 这 个 关系 满足 第 几 范式 ? 
f. 将 PART SUPPLIER 转 化 为 满足 3NE 的 形式 。 


表 5-2 零件 和 供 货 商 的 示例 数据 


Part_No. Description Vendor_Name Address Unit_Cost 

1234 Logic chip Fast Chips Cupertino 10.00 
Smart Chips Phoenix 8.00 

5678 Memory chip Fast Chips Cupertino 3.00 
Quality Chips Austin 2.00 
Smart Chips Phoenix 5.00 


7. 表 5-3 中 表示 了 大 学 里 名 为 GRADE REPORT 的 关系 ， 王 面 是 这 个 关系 里 函数 依赖 的 槛 
述 : 


* Student_ID ~ Student_Name, Campus_Address, Major 
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® Course_ID — Course_Title, Instructor_Name, Instructor_Location 
* Student_[ID, Course_ID— Grade 
。 Instructor_Name — Instructor_Location 
请 根据 这 些 信 息 完 成 下 列 练习 : 
a. 画 出 它 的 关系 模型 图 (类似 图 5-23)， 并 标 出 其 中 的 函数 依赖 。 
b. 它 满足 第 几 范 式 ? 
c. 将 GRADE REPORT 分 解 为 满足 3NE 的 形式 。 
d. 为 生成 的 3NF 作 关系 模型 图 ， 并 标 出 其 中 的 参照 完整 性 约束 。 





Customer 










Cust_Address 







Merch_Addr 
V 
中 










Debit Card Credit Card |>© 


二 二 


图 5-29 银行 卡 的 E-R 图 
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表 5-3 关系 GRADE REPORT 








Student Campus_ Course_ Instructor Instructor_ 

Sugent 也 Name Address Major Course_ID Titje Name Location Grade 

168300458 Williams 208 Brooks IS IS 350 Database Codd B 104 A 
Mgt 

268300458 Williams 208 Brooks 1IS 1S 465 Systems Parsons B 317 B 
Analysis 

543291073 Baker 104 Phijlips Accig JS 350 Database Codd B 104 C 
Mgi 

543291073 Baker 104 Phillips Acctg Acct 201 Fund Miller H 310 B 
Acctg 

543291073 Baker 104 Phillips Acctg Mktg 300 Intro Bennett B212 A 
Mktg 





8. 将 图 3-15b (属性 版 本 ) 转化 为 满足 3NF 的 关系 ， 再 将 图 3-15b (联系 版 本 ) 转化 为 满足 
3NF 的 关系 。 将 它们 和 图 5-10 中 的 关系 进行 比较 ， 通 过 比较 这 两 组 不 同 的 3NF 关 系 ， 你 可 以 得 
到 什么 样 的 结论 ? 

应 用 练习 

1. 咨询 企业 内 的 系统 和 数据 库 设 计 和 人员， 询问 他 们 进行 逻辑 设计 的 步骤 。 他 们 是 如 何 将 概 
念 数据 模型 (比如 E-R 图 ) 转化 为 关系 模型 的 ”在 转换 过 程 中 ，CASE 工 具有 何 作用 ?他 们 使 
用 规范 化 吗 ? 如 果 使 用 ， 能 达到 什么 级 别 ? 

2. 收集 一 些 资料 ， 如 汽车 修理 店 的 销售 凭据 、 顾 客 发 票 、 信 用 卡 的 结账 单 等 ， 然 后 完成 以 
下 的 练习 : 

a. 列 出 其 中 的 属性 。 

b. 列 出 属性 间 的 函数 依赖 (作出 必要 的 假设 )。 

c. 画 出 这 个 关系 的 模式 图 ( 类似 图 5-23 ) ， 并 标 出 函数 依赖 。 

d. 将 它 分 解 为 满足 3NF 的 关系 ， 并 画 出 关系 模式 图 ( 类似 图 5-5 )。 

3. 收集 3 个 常见 的 基于 PC 的 CASE 工 具 的 文档 ， 并 比较 它们 表示 关系 模型 的 表示 方法 。 读 
者 可 以 登录 以 下 的 网 址 来 获取 这 些 工 具 的 联机 信息 : 

a. Microsoft Access: www.microsoft.com/Visual Tools/ 
b. Erwin: www.logicworks.com 
c. EasyER: www.esti.com 

4. 寻找 一 些 商 业 机 构 的 表单 或 报表 ， 如 结账 单 、 票 据 ， 或 是 你 收 到 的 其 他 文档 。 为 这 个 表 
单 或 报表 中 的 数据 作出 EER 图 ， 然 后 将 其 转化 为 满足 3NF 的 关系 。 
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*。 http://databases.about.com/compute/databases/msub0045.htm” 这 是 About Network 上 的 一 个 
页 面 ， 它 介绍 规范 化 的 概念 。 
* http://oracle.com/tools/designer Oracle 公 司 是 数据 库 产品 的 主流 厂商 之 一 ， 它 的 产品 包括 
CASE 工 具 Designer。Designer 可 以 帮助 数据 库 分 析 人 员 绘制 E-R 图 ， 并 自动 地 将 E-R 图 转 
化 为 满足 3NF 的 关系 。 读 者 也 可 以 去 搜索 一 下 其 他 CASE 工 具 供应 商 的 网 站 。 
*www.troubleshooters.com/littslip/Itnorm.html] 这 是 Steve Litt 网 站 上 的 一 个 页 面 ， 它 包含 大 
量 排 除 系 统 开 发 和 程序 设计 中 错误 的 小 技巧 。 
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项 目 案例 : 山 景 社区 医院 


在 前 面 的 几 章 中 ， 我 们 已 经 介绍 了 山 景 社区 医院 的 案例 。 在 本 章 中 ， 我 们 继续 研究 这 个 案 
例 ， 并 将 重点 放 在 对 关系 数据 模型 进行 逻辑 设计 上 。 虽 然 这 个 医院 还 会 继续 评估 新 的 面向 对 象 
和 对 象 -关系 技术 ， 但 是 在 未 来 的 几 年 内 ， 关 系 技术 仍 会 在 它 的 系统 开发 中 占据 主导 地 位 。 

项 目 问题 

1) 为 什么 尽管 新 技术 在 不 断 出 现 ， 山 景 社区 医院 却 仍然 使 用 关系 技术 进行 系统 开发 ? 

2) 山 景 社区 医院 应 该 在 关系 数据 库 设计 中 使 用 规范 化 吗 ? 为 什么 ? 

3) 为 什么 对 于 医院 来 说 ， 实 体 完整 性 和 参照 完整 性 很 重要 ? 

4) 数据 规范 化 会 涉及 医院 内 的 哪些 人 员 ? 

项 目 练习 

你 的 任务 是 为 山 景 社区 医院 进行 逻辑 数据 库 设计 。 在 第 3 章 和 第 4 章 中 ， 你 已 经 开发 出 它 的 
概念 数据 模型 。 具 体 来 说 ， 在 前 几 童 里 你 完成 了 如 下 准备 工作 : 

* 为 医院 中 主要 实体 和 实体 间 联系 绘制 了 E-R 图 (第 3 章 的 项 目 练习 2)。 

“绘制 了 强调 医院 内 人 力 资源 的 EER 图 (第 4 章 的 项 目 练习 1)。 

请 基于 其 中 的 一 个 (或 两 个 ) 概念 设计 进行 逻辑 设计 。 对 于 每 一 个 逻辑 设计 ， 需 要 进行 以 
的 工作 : 

1) 使 用 本 章 所 介绍 的 技术 将 E-R (或 EER ) 图 映射 到 关系 模型 ， 在 图 中 要 为 所 有 的 主键 属 
性 加 下 划 线 ， 包 括 所 有 必要 的 外 键 ， 并 指明 参照 完整 性 约束 。 

2) 为 每 个 关系 绘 出 函数 依赖 。 

3) 将 不 满足 3NF 的 关系 分 解 为 满足 3NF 的 形式 ， 并 据 此 修改 关系 模型 图 。 

4) 为 每 个 关系 创建 企业 键 ， 并 重新 定义 所 有 关系 。 

5) 为 上 一 步 创建 的 每 个 关系 写 出 CREATE TABLE 命 令 ， 对 关系 中 每 个 属性 的 数据 类 型 做 
出 合理 的 假设 。 

6) 如 果 你 为 两 章 中 的 E-R 图 都 作 过 多 辑 设计 ， 将 它们 合并 为 一 个 满足 3NF 的 关系 集 ， 
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6.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

"定义 下 列 关键 术语 : 字段 、 数 据 类 型 、 物 理 记录 、 页 、 块 因子 、 非 规范 化 、 水 平分 割 、 
垂直 分 割 、 物 理 文件 、 表 空间 、 区 、 指 针 、 文 件 组 织 、 顺 序 文件 组 织 、 索 引文 件 组 织 、 
索引 、 辅 键 、 位 图 索引 、 联 结 索引 、 散 列 文件 组 织 、 散 列 算法 、 散 列 索引 表 、 廉 价 宛 余 
磁盘 阵列 (RAID ) 和 条 。 

* 描述 物理 数据 库 设 计 的 过 程 ， 设 计 目 标 和 交付 产品 。 

“为 逻辑 数据 模型 中 的 属性 选择 存储 格式 。 

* 通过 平衡 多 种 重要 的 设计 因素 ， 选 择 合适 的 文件 组 织 方法 。 

“描述 三 种 主要 的 文件 组 织 方法 。 

。 了解 设 置 索引 的 目的 和 索引 属性 的 选择 要 素 。 

“将 关系 数据 模式 转化 为 高 效率 的 数据 库 结构 ， 了 解 何 时 和 如 何 对 逻辑 数据 模式 进行 非 规 
范 化 。 


6.2 引言 


从 第 3 章 到 第 5 章 ， 我 们 已 经 学 习 了 在 数据 库 开 发 过 程 的 概念 数据 建 模 和 逻辑 数据 库 设 计 阶 
段 ， 如 何 对 数据 进行 描述 和 建 模 。 我 们 已 经 掌握 了 如 何 使 用 ERR 表 示 方 法 、 关 系数 据 模型 和 规 
范 化 的 技术 来 抽象 化 组 织 内 的 数据 ， 同 时 表达 数据 的 含义 。 但 是 这 种 表示 方法 不 涉及 如 何 处 理 
和 存储 数据 。 物 理 数据 库 设 计 的 目的 是 将 数据 的 逻辑 描述 转化 为 存 取 数 据 的 技术 规格 说 明 。 设 
计 的 目标 是 设计 合理 的 存储 数据 的 方法 ， 以 提供 足够 的 性 能 ， 并 确保 数据 库 的 完整 性 ， 安 全 性 
和 可 恢复 性 。 

物理 数据 库 设 计 不 包括 实现 文件 和 数据 库 (比如 创建 它们 并 向 其 中 加 载 数据 )。 物 理 数据 
库 设 计 产 生 相应 的 技术 规格 说 明 ， 程 序 员 和 其 他 从 事 信息 系统 建设 的 人 员 会 在 实现 阶段 使 用 它 
们 ， 第 7? 章 到 第 i1 章 会 介绍 实现 阶段 的 内 容 。 

本 章 会 介绍 高 效 的 物理 数据 库 设计 的 基本 步 哺 ,本 章 重点 介绍 独立 、 集 中 式 的 数据 库 系 统 ， 
在 第 13 章 中 会 讨论 如 何 设计 存放 在 多 个 分 布 式 地 点 上 的 数据 库 。 本 章 会 介绍 如 何 估算 用 户 所 需 
的 数据 库 中 的 数据 量 和 使 用 数据 的 具体 方式 。 本 章 还 会 介绍 存储 属性 值 的 不 同方 法 ， 以 及 如 何 
根据 需要 选择 合适 的 方法 。 读 者 会 了 解 到 为 什么 规范 化 的 表 不 一 定 可 以 组 成 最 好 的 物理 数据 文 
件 ， 以 及 如 何 对 数据 进行 非 规范 化 以 加 快 数据 的 检索 速度 。 读 者 会 了 解 不 同 的 文件 组 织 方式 和 
索引 的 使 用 ， 索 引 对 于 加 快 数据 检索 速度 非常 重要 ， 本 章 还 会 向 读者 介绍 不 同 数据 库 体系 结构 
之 间 的 主要 差别 。 

进行 物理 数据 库 设计 时 必须 非常 仔细 , 因为 在 这 一 阶段 所 作 的 决策 会 对 数据 库 的 可 访问 性 、 
响应 时 间 、 安 全 性 、 用 户 界面 友好 性 和 其 他 类 似 的 信息 系统 设计 因素 产生 重大 影响 。 数 据 库 管 
理 (参见 第 12 章 ) 对 于 物理 数据 库 设 计 也 有 很 大 影响 ， 我 们 会 在 第 12 章 中 进一步 讨论 一 些 高 级 
的 设计 问题 。 
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6.3 物理 数据 库 设计 步骤 


在 大 多 数 情况 下 ， 一 旦 选 定 信息 系统 所 使 用 的 数据 库 管 理 技术 ， 许 多 物理 数据 库 设 计 的 问 
题 就 已 经 被 确定 下 来 。 因 为 很 多 组 织 对 于 操作 系统 、 数 据 库 管 理 系统 和 数据 访问 语言 都 有 相应 
的 标准 ， 所 以 设计 人 员 要 讨论 一 些 在 可 选 技术 中 没有 明确 解决 的 问题 。 因 此 我 们 只 集中 讨论 那 
些 设 计 人 员 经 常 需要 考虑 的 问题 ， 以 及 一 些 对 于 某 些 类 型 的 应 用 特别 关键 的 问题 ， 比 如 联机 的 
数据 捕捉 和 检索 。 

物理 数据 库 设 计 的 最 主要 目标 是 对 数据 的 处 理 能 力 。 在 计算 技术 的 单位 计算 成 本 (包括 运 
算 速度 和 存储 空间 ) 不 断 下 降 的 今天 ， 如 何 缩短 用 户 与 信息 系统 交互 所 花费 的 时 间 就 显得 非常 
重要 。 在 下 面 的 讨论 中 ， 我 们 重点 讨论 如 何 使 对 物理 文件 和 数据 库 的 处 理 更 高 效 ， 而 不 是 空间 
的 使 用 效率 。 

物理 文件 和 数据 库 的 设计 需要 用 到 一 些 在 前 面 步骤 中 所 收集 和 产生 的 数据 。 物 理 文 件 和 数 
据 库 设 计 所 需 的 信息 包括 如 下 的 一 些 需 求 : 

“规范 化 的 关系 ， 包 括 对 量 (volume) 的 估计 。 

。 每 个 属性 的 定义 。 

“对 于 数据 使 用 时 间 和 使 用 地 点 的 描述 : 输入、 检索、 删除 和 更 新 (包括 频 度 )。 

" 对 于 数据 响应 时 间 、 安 全 性 、 备 份 、 恢 复 、 保 持 和 完整 性 的 预期 及 要 求 。 

* 描述 实现 数据 库 所 使 用 的 技术 (数据 库 管 理 系统 ) 的 信息 。 

在 物理 数据 库 设计 中 ， 要 作出 一 些 重要 的 决定 ， 它 们 会 对 应 用 系统 的 完整 性 和 性 能 造成 影 
响 ， 这 些 关键 决策 包括 : , | 

1) 为 逻辑 数据 模型 中 的 每 个 属性 选择 存储 的 格式 ( 称 为 数据 类 型 )， 以 便 使 存储 空间 最 小 
而 数据 完整 性 最 佳 。 

2) 将 逻辑 数据 模型 中 的 属性 分 组 成 为 物理 记录 。 虽 然 关 系 表 的 列 会 很 自然 地 当 作物 理 记录 
的 内 容 ， 但 却 不 一 定 是 最 好 的 属性 分 组 。 

3) 将 相似 的 结构 化 记录 安排 在 二 级 存储 ( 主要 是 磁盘 ) 中 ， 以 便 单 个 记录 和 记录 组 ( 称 为 
文件 组 织 ) 可 以 快速 地 存储 、 检 索 和 更 新 。 还 需要 考虑 数据 的 保护 和 在 发 现 错误 后 恢复 数据 的 
问题 。 

4) 选择 存储 和 联接 文件 的 方式 ( 称 为 索引 和 数据 库 体系 结构 )， 使 相关 数据 的 检索 效率 更 
高 。 
5) 准备 处 理 数 据 库 查 询 的 适当 的 策略 ， 该 策略 可 以 优化 性 能 并 利用 所 定义 的 文件 组 织 和 索 
引 。 只 有 当 查 询 和 数据 库 管理 系统 可 以 有 效 地 利用 某 种 数据 库 结构 时 ， 这 种 数据 库 结构 才 可 能 
显示 出 优越 性 。 
数据 量 和 使 用 分 析 

前 面 已 经 提 到 ， 数 据 量 及 数据 的 使 用 频 度 是 物理 数据 库 设计 过 程 的 重要 参考 因素 。 所 以 在 
逻辑 数据 库 设 计 的 最 后 阶段 或 是 物理 数据 库 设计 的 最 初 阶段 ， 分 析 人 员 必 须 对 数据 库 系 统 的 规 
模 大 小 及 其 使 用 模式 进行 估计 。 

通过 在 对 应 于 人 逻辑 数据 库 设计 所 产生 的 规范 化 关系 的 EER 图 添加 符号 ， 可 以 很 容易 地 表示 
有 关 数 据 量 和 使 用 情况 的 信息 。 图 6-1 是 松 谷 家 具 公 司 的 一 个 简单 库存 数据 库 的 EER 图 (没有 
标 出 属性 )。 这 个 EER 图 中 是 逻辑 数据 库 设 计 得 到 的 规范 化 关系 ， 其 原始 的 概念 数据 模型 在 图 
4-7b 中 显示 。 图 4-7b 中 的 多 对 多 联系 Supplies 在 图 6-1 中 表示 为 关联 实体 QUOTATION ， 它 是 由 
这 个 联系 所 创建 的 关系 。 
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图 6-! 中 显示 了 数据 量 和 访问 频 度 的 相关 信息 。 比 如 ， 数 据 库 内 共有 1000 个 PART。 超 类 型 
PART 有 两 个 子 类 型 ，MANUFACTURED (40% 的 PART 是 自主 生产 的 ) 和 PURCHASED (70% 
的 PART 是 购买 的 ， 由 于 某 些 PART 同时 具有 两 种 子 类 型 ， 所 以 总 和 超过 100% )。 松 谷 家 具 公 司 
的 分 析 人 员 估 计 ， 大 约 有 50 个 常 联系 的 SUPPLIER ， 平 均 每 个 供应 商 提 供 50 个 QUOTATION ， 
所 以 共有 2500 个 QUOTAITION。 图 中 的 虚线 箭头 代表 访问 频 度 。 比 如 ， 所 有 使 用 该 数据 库 的 应 
用 ， 每 小 时 大 约 访问 PART 数据 200 次 。 根 据 数据 比例 ， 每 小 时 对 PURCHASED PART 数据 访问 
140 次 ， 此 外 对 PURCHASED PART 数据 还 有 另外 60 次 直接 访问 。 在 所 有 对 PURCHASE PART 
的 200 次 访问 中 ，80 次 同时 访问 QUOTATION 数 据 ; 在 这 80 次 访问 中 ， 又 有 70 次 随即 使 用 
SUPPLIER 数 据 。 对 于 联机 的 和 基于 Web 的 应 用 来 说 ， 使 用 图 要 表示 每 秒 的 访问 。 在 一 天 之 内 
的 不 同时 段 ， 可 能 需要 使 用 多 张 使 用 图 来 反映 不 同 的 使 用 模式 。 性 能 同时 会 受到 网 络 规格 说 明 
的 影响 。 


机 


MANUFACTURED 


PART < QUOTATION 
400 ~ 人 A 





图 6-! 复合 使 用 图 ( 松 谷 家 具 公 司 ) 


分 析 人 员 在 系统 开发 过 程 的 系统 分 析 阶段 中 ， 通 过 研究 当前 和 预期 的 数据 处 理 和 业务 活动 
来 生成 有 关 数 据 量 及 使 用 频 度 的 数据 。 数 据 量 的 大 小 代表 业务 的 规模 ， 在 估算 时 至 少 需要 考虑 
到 未 来 几 年 可 能 的 业务 增长 。 访 问 频 度 的 信息 则 是 通过 对 事件 的 时 间 控制 、 事 务 量 、 并 发 用 户 
的 数量 ， 报 表 及 查询 活动 等 进行 分 析 而 估算 出 来 的 。 由 于 很 多 数据 库 系统 支持 即席 访问 ， 这 种 
访问 可 能 随时 间 的 流逝 发 生 很 大 的 变化 。 在 一 个 月 、 一 周 以 及 一 天 内 已 知 的 数据 库 访 问 可 能 会 
有 高 峰 和 低谷 ， 访 问 的 频 度 更 为 不 确定 ， 因 此 对 频 度 的 合计 往往 比 对 数据 量 的 估计 更 难 进行 。 
装运 的 是 ， 在 这 个 过 程 中 通常 并 不 需要 精确 的 数值 ， 更 为 重要 的 是 数值 的 相对 大 小 ， 以 提示 哪 
些 问题 最 值得 关注 以 得 到 可 能 的 最 优 性 能 。 比 如 ， 在 图 6-1 中 可 以 看 到 每 小 时 对 于 QUOTATION 
的 40 次 访问 ， 都 同时 访问 PURCHASED PART。 这 表明 将 这 两 个 实体 合并 成 一 个 数据 库 表 (或 
文 作 ) 会 获得 更 好 的 性 能 。 这 种 合并 规范 化 表 的 操作 是 非 规范 化 的 一 个 例子 ， 我 们 会 在 后 面 详 
细 讨 论 。 

如 果 可 以 分 析 虚 线 所 表示 的 访问 路 径 的 实质 ， 则 会 有 利于 随后 的 物理 数据 库 设 计 。 比 如 ， 
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如 果 知 道 在 对 PART 数据 的 200 次 访问 中 ，150 次 通过 指定 主键 Part_No 的 值 来 寻找 一 个 零件 或 一 
组 零件 (比如 访问 某 个 特定 零件 号 的 零件 ) ， 而 其 余 50 次 是 通过 属性 Qty_on_Hand 的 值 来 访问 
合格 的 零件 的 (图 6-1 中 没有 给 出 )。 这 些 更 为 精确 的 描述 有 助 于 为 表 选 择 索 引 ， 这 是 我 们 后 面 
要 讨论 的 一 个 重要 课题 。 知 道 对 数据 的 访问 是 否 会 导致 数 据 被 创建 、 检 索 、 更 新 或 删除 也 很 有 
帮助 。 这 些 对 于 访问 频 度 的 精细 描述 可 以 用 附加 的 符号 标注 在 像 图 6-1 一 样 的 图 上 ， 或 是 在 其 
他 文档 中 用 文本 和 表格 的 形式 记录 下 来 。 


6.4 设计 字段 


字段 (field) 是 可 以 被 系统 软件 (如 程序 设计 语言 或 数据 库 管理 系统 ) 识别 的 最 小 的 应 用 数 
据 单元 。 一 个 字段 对 应 于 逻辑 数据 模型 的 简单 属性 ， 所 以 一 个 字段 代表 复合 属性 中 的 一 个 属性 。 

在 对 字段 进行 设计 时 ， 最 基本 的 决策 就 是 确定 代表 该 字段 值 的 数据 类 型 (或 存储 类 型 )， 
数据 库 系统 内 建 的 数据 完整 性 控制 ， 以 及 DBMS 如 何 处 理 这 个 字段 可 能 丢失 的 值 。 其 他 的 字段 
规格 说 明 还 包括 数据 的 显示 格式 等 ， 虽 然 它们 也 是 整个 信息 系统 规格 说 明 的 必要 部 分 ， 但 是 我 
们 在 这 里 不 予 讨论 ， 因 为 它们 通常 由 程序 而 不 是 DBMS 来 处 理 。 
6.4.1 选择 数据 类 型 

数据 类 型 (data type) 是 系统 软件 (如 DBMS ) 可 识别 的 用 于 表示 组 织 数据 的 具体 编码 方 
案 。 虽 然 位 模式 的 编码 方案 通常 是 对 用 户 透 明 的 ， 但 数据 的 存储 空间 和 数据 访问 的 速度 却 是 物 
理 数据 库 设计 的 重点 。 使 用 的 特定 数据 库 管 理 系 统 往往 会 决定 用 户 采 取 哪 一 种 方案 。 表 6-1 列 
举 出 Oracle 8i 数据 库 管 理 系统 所 提供 的 数据 类 型 ， 这 是 一 个 典型 的 使 用 SQL 数据 定义 语言 和 数 
据 操纵 语言 的 数据 库 管理 系统 。 在 其 他 数据 库 管 理 系统 中 ， 可 能 还 提供 一 些 用 于 货币 、 声 音 、 
图 像 和 用 户 自 定义 的 数据 类 型 。 


表 6-1 Oracle 8i 中 的 数据 类 型 


数据 类 型 . 描述 

VARCHAR2 a 最 大 长 度 为 4000 个 字符 。 必 须 为 其 输入 最 大 字段 长 度 (比如 VARCHAR2 
(30) 表明 字段 的 最 大 字段 长 度 为 30 字 符 )。 -个 长 度 小 于 30 字 符 的 值 只 会 占据 它 需 要 的 空间 

CHAR 定 长 的 字符 数据 ， 节 大 长 度 为 2000 字 符 。 默 认 的 长 度 为 1 (比如 CHAR (5) 定义 个 固定 长 度 
为 5 字符 的 字段 ， 可 以 容纳 长 度 为 0 ~ 5 个 字符 的 值 ) 

LONG 可 以 容纳 最 大 4G 宇 符 的 变 长 字符 数据 字段 (例如 用 于 存放 用 药 说 明 或 顾客 建议 ) 

NUMBER 从 10 "到 102 的 正 数 和 负数 ， 可 以 指定 精度 《小数点 两 边 的 位 数 二 和) 和 数值 范围 (小数点 


人 (比如 ，NUMBER (5) 是 -个 最 多 5 个 数字 的 整数 字段 ， 而 NUMBER (5，2) 定 - 
一 个 最 多 5 个 数字 ， 小 数 点 右边 有 2 个 数字 的 字段 ) 


DATE i $s 元 前 4712 年 1 月 1 日 到 公元 4712 年 12 月 31 日 的 白 期 ， 其 中 包括 世纪 、 年 、 月 、HH、 小 时 、 
分 钟 和 种 
BLOB 二 进 制 的 大 对 象 ，o 可 以 存储 最 大 呈 达 4G 的 .二进制 数据 (比如 照片 或 声音 剪辑 ) 


数据 类 型 的 选择 要 考虑 到 以 下 四 个 目标 ， 它 们 在 不 同 应 用 中 的 重要 程度 也 不 同 : 

1) 将 存储 空间 最 小 化 。 

2) 表示 所 有 可 能 的 值 。 

3) 改善 数据 完整 性 。 

4) 支持 所 有 数据 操纵 。 

选择 正确 的 数据 类 型 能 够 占用 最 小 的 空间 ， 表 示 相 关 属 性 所 有 可 能 的 值 (但 去 除 不 合法 的 
值 )， 并 支持 相应 的 数据 操纵 〈 如 数字 数据 类 型 可 进行 数学 运算 , 字符 类 型 可 进行 字符 串 操 作 )。 
概念 数据 模型 中 关于 属性 域 约束 的 信息 也 有 助 于 为 属性 选择 合适 的 数据 类 型 。 达 到 数据 类 型 以 
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上 的 四 个 目标 需要 做 一 些 巧妙 的 安排 。 假 设 在 一 个 DBMS 中 ， 基 个 数据 类 型 的 最 大 长 度 为 2 个 
字 节 ， 假 设 它 足 以 存储 表示 销售 数量 的 字段 。 但 是 当 对 所 有 销售 数量 字段 求 和 时 ，2 个 字 节 可 
能 就 不 够 存储 这 个 和 值 。 如 果 DBMS 使 用 同样 的 数据 类 型 来 存放 其 他 数学 运算 的 结果 ， 就 会 产 
生 严重 的 同 题 。 此 外 ， 某 些 数据 类 型 有 其 独 有 的 处 理 功能 ， 比 如 只 有 DATE 类 型 上 才能 进行 真 
正 的 日 期 计算 。 
编码 和 压缩 技术 

某 些 属性 的 取 值 是 稀疏 的 ， 但 是 范围 却 又 很 广 ， 因 此 会 消 耗 大 量 的 存储 空间 (大 的 数据 字 
段 意味 着 数据 距离 远 ， 这 会 使 数据 的 处 理 速度 变 慢 )。 可 以 通过 为 一 个 只 能 在 几 个 可 能 值 内 选 
取 的 字段 进行 编码 来 节省 空间 。 考 虑 图 6-2 中 产品 的 Finish 字 段 的 例子 。 松 谷 家 具 公 司 只 使 用 几 
种 有 限 的 木材 : Birch、Maple 和 Oak。 通 过 创建 一 张 编 码 表 或 转换 表 ， 每 个 Finish 字 段 值 可 以 用 
一 个 编码 来 代替 ， 该 编码 以 类 似 于 外 键 的 方式 交叉 引用 查找 表 。 这 样 会 节省 Finish 字 段 的 存储 
空间 ， 从 而 节省 PRODUCT 文 件 的 存储 空间 。 但 是 查找 表 需 要 额外 的 空间 ， 当 查询 Finish 字 段 的 
值 时 ， 需 要 对 查找 表 进 行 一 次 额外 访问 。 如 果 Finish 字 段 很 少 使 用 ， 或 是 不 同 的 Finish 字 段 值 很 
多 ， 那么 额外 的 开销 远 远 大 于 带 来 的 益处 。 需 要 注意 的 是 ， 编 码 表 并 没有 出 现在 概念 或 逻辑 设 
计 模 型 中 ， 它 只 是 一 个 用 来 提高 数据 处 理性 能 的 物理 结构 ， 而 不 是 带 有 业务 值 的 一 组 数据 。 

数据 压缩 技术 往往 使 用 某 种 形式 的 编码 表 ， 如 文件 的 zip 压 缩 方法 。 数 据 压缩 技术 在 数据 
中 寻找 模式 ， 然 后 用 较 少 的 位 数 为 常见 的 模式 编码 。 虽 然 类 似 的 技术 常常 用 于 压缩 整个 文件 ， 
但 也 可 以 在 一 些 DBMS 中 用 于 压缩 特定 的 字段 。 与 数据 压缩 技术 相关 的 是 加 密 技 术 ， 它 将 字段 
转化 为 一 种 安全 的 格式 。 在 压缩 和 加 密 后 ， 软 件 必须 知道 如 何 进行 相应 的 操作 才能 使 用 户 看 到 
实际 的 字段 值 。 

PRODUCT 文 件 FINISH 查 找 表 





图 6-2 代码 查找 表示 例 ( 松 谷 家 具 公司 ) 


6.4.2 数据 完整 性 控制 
对 于 很 多 DBMS ， 数 据 完整 性 控制 (如 控制 一 个 字段 的 可 能 值 ) 可 以 内 建 到 字段 的 物理 结构 
中 ， 并 由 数据 库 管理 系统 对 这 些 字段 执行 控制 。 数 据 类 型 也 是 数据 完整 性 的 一 种 ， 因 为 它 限制 数 
据 的 类 型 (数字 型 或 字符 型 ) 和 字段 值 的 长 度 。DBMS 可 以 提供 的 其 他 常见 的 完整 性 控制 包括 ; 
“默认 值 ” 当 用 户 没 有 为 字段 输入 值 时 ， 系 统 就 为 该 字段 赋予 默认 值 。 为 字段 赋予 默认 值 
可 以 缩短 用 户 数据 输入 的 时 间 ， 因 为 字段 值 的 输入 可 以 跳 过 ; 此 外 对 于 常用 的 值 它 可 以 
减少 数据 输入 的 错误 。 
* 范围 控制 ”范围 控制 限定 一 个 字段 允许 输入 的 值 ， 它 的 范围 可 以 是 数字 的 上 界 和 下 界 ， 
也 可 以 是 一 组 特定 的 值 。 由 于 范围 限制 可 能 随时 间 变 化 ， 所 以 必须 小 心地 被 使 用 范围 控 
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制 。 范 围 控 制 和 编码 的 结合 导致 许多 组 织 必 须 面 对 2000 年 问题 ， 因 为 存储 年 的 字段 范围 

限定 为 00 ~ 99。 应 该 在 DBMS 内 部 实现 范围 控制 而 不 是 在 程序 中 实现 ， 因 为 在 程序 中 实 

现 往往 会 出 现 不 一 致 ， 而 且 难 以 查找 和 修改 。 

“ 空 值 控制 ”在 第 5 章 中 ， 我 们 定义 空 值 。 所 有 的 主键 必须 有 完整 性 控制 以 避免 空 值 。 其 他 

一 些 所 需 的 字段 也 应 该 根据 组 织 策 略 进行 相应 的 控制 以 避免 空 值 。 比 如 ， 某 个 大 学 可 能 

禁止 将 一 门 课 加 入 到 数据 库 中 ， 除 非 该 课程 有 课程 名 和 相应 的 主键 值 Course_ID。 应 该 只 

在 确实 受 业 务 规则 限制 而 不 允许 空 值 的 字段 上 使 用 这 种 控制 ， 因 为 很 多 字段 是 可 以 使 用 

空 值 的 。 

。 参照 完 整 性 ”按照 第 5 章 中 的 定义 ， 参 照 完整 性 也 可 以 看 作 是 一 种 范围 控制 。 因 为 该 字段 

的 值 在 同一 张 表 或 其 他 表 的 另 一 行 的 字段 中 存在 ; 换 句 话说 ， 值 的 合法 范围 是 由 数据 座 

表 的 某 个 字段 的 动态 内 容 来 确定 的 ， 而 不 来 自 于 预先 定义 的 值 集 。 需 要 指出 的 是 ， 参 照 

完整 性 保证 只 取 那 些 已 经 存在 的 交叉 引用 的 值 ， 而 不 能 确保 取 值 的 正确 。 
处 理 缺 失 的 数据 

当 某 个 字段 的 值 可 以 为 空 时 ， 用 户 可 能 就 不 为 它 输入 值 。 比 如 ， 在 某 个 数据 库 系统 中 ， 顾 
客 的 邮政 编码 字段 可 以 为 室 ， 而 同时 系统 中 有 一 个 根据 月 份 和 邮政 编码 对 销售 情况 进行 汇总 的 
报表 。 此 时 的 问题 是 ， 如 何在 未 知 邮政 编码 的 情况 下 统计 销售 情况 呢 ? 我 们 前 面 已 经 提 到 两 种 
处 理 和 防止 数据 缺失 的 可 选 方法 : 提供 默认 值 和 不 允许 为 空 。 通 常情 况 下 ,， 空 值 是 不 可 避免 的 。 
根据 Babad 和 Hoffer (1984) 的 研究 ， 还 有 其 他 一 些 可 行 的 处 理 缺 失 数 据 的 方法 : 

1) 为 缺失 数据 提供 一 个 估计 值 。 例 如 ， 在 计算 某 种 产品 某 月 的 销售 情况 时 ， 对 于 缺失 的 数 
据 值 ， 可 以 使 用 一 个 包含 已 有 的 该 产品 月 度 销售 数值 的 平均 值 和 这 个 月 的 所 有 产品 的 销售 量 的 
公式 来 计算 值 。 类 似 的 估计 值 需要 特别 标注 ， 以 使 用 户 知道 它 不 是 实际 的 值 。 

2) 跟踪 缺失 的 数据 以 产生 报表 或 其 他 系统 信息 ， 使 人 们 尽快 地 找到 相应 的 数据 。 这 可 以 通 
过 在 数据 库 上 定义 中 设置 一 个 触发 器 来 实现 。 触 发 器 是 一 个 例 程 ， 它 会 在 某 种 情况 发 生 或 是 在 
某 段 时 间 过 去 后 自动 执行 。 当 空 值 或 其 他 丢失 值 被 存储 时 ， 一 个 触发 器 可 以 将 这 个 信息 记录 到 
文件 里 ; 而 另 一 个 触发 器 可 以 每 隔 一 段 时 间 就 为 这 个 日 志文 件 生 成 报表 。 

3) 执行 敏感 性 测试 ， 除 非 在 测试 中 发 现 它们 会 对 最 终 的 结果 产生 很 大 的 影响 ， 否 则 可 以 
忽略 缺失 的 数据 。 比 如 一 个 销售 人 员 的 月 销售 额 决定 他 的 薪水 ， 而 缺失 的 数据 会 影响 他 的 业 
绩 ， 从 而 影响 他 该 月 的 收入 。 这 是 到 目前 为 止 最 复杂 的 一 种 方法 ， 需 要 仔细 地 编写 程序 。 这 
些 处 理 缺失 值 的 例 程 可 以 在 应 用 程序 中 编写 。 很 多 的 现代 数据 库 管 理 系 统 具 有 更 强 的 编程 能 
力 ， 如 编写 case 表 达 式 、 用 户 定义 函数 和 触发 器 等 ， 所 以 类 似 的 逻辑 可 以 在 数据 库 内 部 实现 而 
与 特定 应 用 无 关 。 


6.5 设计 物理 记录 和 非 规范 化 


在 逻辑 数据 模型 中 ， 由 于 同一 个 主键 决定 的 属性 被 放 到 一 个 关系 里 。 与 之 相反 ， 物 理 记录 
(physical record) 是 一 组 在 内 存 里 相 邻 存放 的 字段 ， 它 们 是 DBMS 读 写 的 一 个 基本 单元 。 设 计 
物理 记录 时 要 选择 字段 在 相 邻 存 储 空间 的 顺序 ， 以 期 达到 两 个 目的 : 二 级 存储 的 有 效 使 用 和 提 
高 数据 处 理 的 速度 。 

二 级 存储 的 有 效 使 用 取决 于 物理 记录 的 大 小 和 二 级 存储 的 结构 。 计 算 机 的 操作 系统 以 页 而 
不 是 物理 记录 为 单元 读 取 数 据 。 页 (page) 是 操作 系统 在 二 级 存储 的 一 次 输入 或 输出 操作 中 所 
读 写 的 数据 量 。 页 的 大 小 是 固定 的 ， 由 系统 程序 员 设 定 以 便 所 有 的 应 用 更 有 效 地 使 用 内 存 。 在 
某 些 系 统 中 ， 物 理 记录 可 以 跨 页 ， 而 在 某 些 系统 中 则 不 能 跨 页 。 因 此 如 果 页 的 大 小 不 是 物理 记 








录 大 小 的 整数 倍 ， 那 么 在 页 中 就 会 出 现 空间 的 浪费 。 一 页 中 物理 记录 的 数目 称 为 块 因子 
(biocking factor)。 如 果 存 储 空间 不 足 且 物理 记录 不 能 跨 页 ， 那 么 为 一 个 逻辑 关系 创建 多 个 物 
理 记录 会 将 空间 的 浪费 减 到 最 小 。-- 些 数据 库 管理 系统 会 将 多 个 物理 记录 合成 一 个 数据 块 ; 此 
时 DBMS 管 理 数据 块 ， 而 操作 系统 管理 页 。 

非 规范 化 

前 面 对 于 物理 记录 设计 的 讨论 主要 强调 对 存储 空间 的 有 效 使 用 ， 但 在 大 多 数 情况 下 ， 物 理 
记录 设计 的 第 二 个 目标 一 一 高 效 的 数据 处 理 在 设计 过 程 占 主导 地 位 。 数 据 的 高 效率 处 理 和 在 图 
书馆 中 取 书 一 样 ， 取 决 于 相关 数据 (书籍) 存放 的 紧密 程度 。 通 常情 况 下 ， 一 个 关系 内 的 所 有 
属性 不 会 同时 被 使 用 , 而 不 同 关系 的 属性 常常 组 合 起 来 以 满足 查询 的 要 求 或 是 生成 报表 。 因此 ， 
虽然 规范 化 的 关系 可 以 消除 数据 维护 中 的 异常 ， 并 减少 元 余 、 但 直接 将 规范 化 的 关系 对 应 到 物 
理 记 录 却 未 必 能 产生 高 效率 的 数据 处 理 。 

完全 规范 化 和 部 分 规范 化 的 数据 库 在 处 理性 能 方面 的 差异 有 极 大 的 不 同 ，Inmon (1988) 
对 此 进行 过 量化 的 研究 。 一 个 完全 规范 化 的 数据 库 有 8 个 表 ， 每 个 表 有 50 000 行 ， 另 一 个 部 分 
规范 化 的 数据 库 有 4 个 表 ， 每 个 表 有 25 000 行 ， 而 另 一 个 部 分 规范 化 的 数据 库 有 两 个 表 。 结 果 
表明 部 分 规范 化 数据 库 的 性 能 比 完 全 规范 化 数据 库 的 性 能 超出 一 个 数量 级 。 虽 然 这 个 结果 很 大 
程度 上 取决 于 数据 库 以 及 对 于 数据 库 的 具体 操作 ， 但 仍然 表明 应 该 对 物理 记录 和 规范 化 关系 的 
对 应 问题 进行 认真 考虑 。 

非 规范 化 ”是 将 规范 化 的 关系 转化 为 非 规范 化 的 物理 记录 规格 说 明 的 过 程 。 我 们 在 本 节 中 
讨论 非 规范 化 的 原因 和 各 种 形式 。 概 括 来 说 ， 非 规范 化 可 能 将 一 个 关系 分 解 为 多 个 物理 记录 ， 
可 能 将 来 自 于 不 同 关 系 的 属性 组 合 到 一 个 物理 记录 里 ， 也 可 能 是 两 者 的 结合 。 正 如 Finkelstein 
(1988) 指出 的 ， 非 规范 化 会 增加 错误 和 不 一 致 性 出 现 的 机 会 ， 当 业务 规则 改变 时 甚至 可 能 需 
要 重建 系统 。 此 外 ， 非 规范 化 以 牺牲 一 些 操作 的 效率 为 代价 ， 来 提高 另外 一 些 操作 的 效率 。 如 
果 操 作 发 生 的 频率 有 改变 ， 则 非 规范 化 的 益处 就 不 再 存在 。 非 规范 化 几乎 总 是 导致 原始 数据 的 
存储 空间 增加 ， 也 会 导致 数据 库 开 销 (如 索引 ) 需要 更 多 的 空间 。 因 此 非 规范 化 应 该 在 其 他 物 
理 设计 因素 都 达 不 到 性 能 要 求 时 使 用 ， 并 必须 在 系统 中 显著 地 改善 性 能 。 

Rogers (1989) 介绍 了 几 种 常见 的 适 于 使 用 非 规范 化 的 情况 (图 6-3 ~ 图 6-5 给 出 这 三 种 情 
况 下 的 规范 化 和 非 规范 化 的 关系 ): 

1) 两 个 实体 具有 一 对 一 联系 ”即使 其 中 一 个 实体 是 可 选 的 参与 者 ， 但 只 要 它 在 大 多 数 情 况 
下 存在 ， 就 应 该 考虑 将 两 个 实体 合并 成 一 个 记录 (尤其 在 对 它们 的 访问 频率 很 高 时 )。 图 6-3 中 
是 学 生 的 数据 ， 和 可 选 的 标准 学 位 申请 表 数 据 。 在 这 种 情况 下 ， 可 以 使 用 来 自 于 STUDENT 和 
SCHOLARSHIP APPLICATION 关 系 的 4 个 字段 组 成 记录 (假设 不 再 需要 Application_ ID。 注 意 ， 
在 这 种 情况 下 ， 来 自 于 可 选 一 方 实体 的 字段 值 可 能 为 空 )。 

2) 具有 非 键 属性 的 多 对 多 联系 (关联 实体 ) ”并 非 将 三 个 文件 联结 以 从 关系 的 两 个 基本 实 
体 中 抽取 数据 ， 而 是 将 一 个 实体 和 关联 实体 的 属性 结合 成 一 个 记录 ， 这 样 就 可 以 在 许多 数据 访 
问 模块 中 将 必须 的 联结 操作 减少 一 次 。 和 前 面 一 样 ， 访 问 次 数 越 多 ， 这 种 方法 的 益处 就 越 大 。 
图 6-4 中 是 不 同 供应 商 对 于 不 同 标准 件 制定 的 价格 信息 。 此 时 来 自 于 关系 ITEM 和 PRICE 
QUOTE 的 字段 可 以 被 结合 和 一 个 记录 ， 这 样 就 避免 对 全 部 三 个 文件 进行 联结 (注意 ， 这 样 可 
能 产生 大 量 的 数据 元 余 。 在 这 个 例子 里 ，ITEM 中 的 字段 Description 会 在 每 个 PRICE QUOTE 中 
重复 。 当 该 数据 变动 时 ， 要 进行 许多 的 修改 )。 

3) 引用 数据 “引用 数据 位 于 一 对 多 联系 中 处 于 1 的 一 方 的 实体 中 ， 且 该 实体 不 参与 任何 数 
据 库 内 的 其 他 联系 。 此 时 如 果 对 每 个 1 的 一 方 的 实例 ，M 的 一 方 都 只 有 很 少 的 实例 与 其 对 应 ， 
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那么 就 应 该 考虑 将 两 个 实体 合并 为 一 个 记录 。 在 图 6-5 中 ， 几 个 ITEM 有 相同 的 STORAGE 
INSTRUCTIONS ， 并 且 STORAGE INSTRUCTIONS 只 和 ITEM 相 关 。 在 这 种 情况 下 ， 可 以 将 
STORAGE INSTRUNCTION 数 据 存放 在 ITEM 记 录 中 。 当 然 此 时 会 产生 数据 元 余 和 额外 的 数据 


维护 (不 再 需要 Instr_ID ) 。 


Campus_Address 
STUDENT 


Student_ID | Campus_Address 






Application_Date 






Qualifications 


Application_ID 





规范 化 关系 
STUDENT 














非 规范 化 的 关系 
STUDENT 


Student_ ID | Campus_Address Appicaton_pate| Qualifeations 


Application_Date 和 Qualifications 9 以 为 空 值 


图 6-3 … 种 可 能 的 非 规范 化 情况 : 存在 一 对 一 联系 的 两 个 实体 (注意 : 我 们 假设 当 所 有 字段 都 存储 在 
-个 记录 中 时 ， 不 再 需要 Application_ID。 但 如 果 它 是 必须 的 应 用 数据 时 ， 则 可 以 将 该 字段 包括 进来 ) 


企 上 面谈 到 的 情况 中 ， 都 是 将 表 结 合 起 来 以 避免 联结 操作 。 与 之 相反 ， 非 规范 化 也 可 以 用 
于 将 单个 关系 分 割 为 多 张 表 ， 这 些 分 割 方法 包括 水 平分 割 、 垂 直 分 割 或 是 两 者 的 结合 。 水 平分 
天 (horizontal partitioning) 将 一 个 关系 分 割 为 多 个 记录 规格 说 明 ， 方 法 是 将 关系 的 行 根据 某 
个 列 值 ， 分 别 地 存放 到 不 同 的 记录 中 。 在 图 书馆 里 ， 水 平分 割 类 似 于 将 商业 杂志 放 入 商业 图 书 
馆 , 将 科学 书籍 放 入 科学 图 书馆 ,等 等 。 每 个 经 分 割 创建 的 文件 都 含有 相同 的 记录 布局 。 比 如 ， 
顾客 关系 可 以 根据 字段 Region 的 值 而 分 割 为 4 个 区 域 顾客 文件 。 

当 对 表 中 不 同类 型 的 行 是 单独 处 理 时 ， 利 用 水 平分 割 是 很 有 意义 的 。 例 如 ， 在 前 面 提 到 的 
顾客 表 中 ， 或 许 大 多 数 对 于 数据 的 操作 在 某 一 时 间 都 是 局 限 在 某 个 区 域内 的 。 水 平分 割 也 有 安 
全 性 方面 的 优点 ， 因 为 可 以 使 用 文件 层次 的 安全 性 来 禁止 用 户 查看 某 些 数据 行 。 此 外 ， 对 被 分 
割 出 的 文件 ， 可 以 根据 它们 各 自 的 使 用 情况 来 选择 组 织 方式 。 恢 复 一 个 分 割 后 的 文件 显然 比 恢 
复 含有 所 有 行 的 文件 要 快 得 多 ， 而 且 即 使 某 个 文件 因为 损坏 而 必须 离线 恢复 ， 也 不 会 影响 用 户 
对 于 其 他 文件 的 继续 使 用 。 分 割 后 的 文件 可 以 存放 在 单独 的 磁盘 上 以 避免 对 于 一 个 磁盘 的 争 用 ， 
这 有 助 于 改善 数据 库 系统 性 能 。 表 6-2 中 总 结 了 水 平分 割 的 优点 (实际 是 各 种 分 割 共有 的 ) 和 
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Vendor_ID 
VENDOR 

















Contact_Name 

















规范 化 关系 
VENDOR “ ITEM 
Vendor_ID Address Contact_ Name 
PRICE QUOTE 
Vendor_ID {tem_ID Price 
非 规 范 化 关系 


VENDOR ITEM QUOTE 


¥endor PD encor D em lD | posorpton | Prce | 





图 6-4 一 种 可 能 的 非 规范 化 情况 ， 带 有 非 键 属性 的 多 对 多 联系 


表 6-2 数据 分 割 的 优 缺 点 





分 着 的 优点 

1) 效率 : 共 问 使 用 的 数据 被 存放 在- -起 ， 不 一 起 使 用 的 数据 分 开 存 放 

2) 局 部 优化 ， 某 个 分 割 可 以 根据 白 身 的 使 用 情况 存放 ， 以 优化 性 能 

3) 安全 性 : 和 - 组 用 户 不 相关 的 数据 可 以 和 他 们 需要 使 用 的 数据 分 开 存放 

4) 恢复 和 正常 运行 时 间 : 小 的 文件 可 以 更 快 地 被 恢复 。 即 使 -个 文件 损坏 ， 其 他 文件 仍 可 被 访问 ; 损坏 的 影响 
被 隔离 开 

5) 负载 平衡 : 文件 可 以 存放 在 不 同 的 存储 区 域 ( 磁 司 或 其 他 媒介 ) ， 这 可 以 减少 访问 对 相同 存储 区 域 的 邹 用 ， 并 
允许 对 不 同 区 域 进行 并 行 访问 

分 割 的 缺点 

1) 不 … 敏 的 访问 速度 : 不 同 分 割 的 不 同 访问 速度 可 能 令 用 户 朵 惑 。 尤 其 当 必须 结合 不 同 分 割 的 数据 时 ， 其 响应 
时 间 可 能 大 大 超过 不 分 割 的 情况 

2) 复杂 性 : 分 割 遂 常 对 于 程序 员 是 不 透明 的 ， 在 需要 结合 不 同 分 割 的 数据 时 ， 程 序 会 变 得 更 加 复杂 

3) 额外 的 空间 和 更 新 时 间 : 数据 可 能 需要 在 不 同 分 割 问 重复 ， 这 比 单独 存储 规范 化 的 关系 浪费 空间 。 -个 涉及 
到 多 个 分 割 内 数据 的 更 新 操作 会 需要 更 长 的 时 间 
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STORAGE 
INSTRUCTIONS 
Container_ Type 


规范 化 关系 
STORAGE 
Instr_ID | Where_Store | Container_ Type 




















ITEM 
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图 6-5 一 种 可 能 的 非 规范 化 情况 : 引用 数据 


可 以 看 到 ， 水 平分 割 和 创建 超 类 型 / 子 类 型 联系 非常 相似 ， 因 为 不 同类 型 的 实体 (其 中 使 
用 子 类 型 鉴别 符 字段 来 隔离 行 ) 会 参与 不 同 的 联系 ， 从 而 导致 不 同 的 处 理 。 在 面 对 一 个 超 类 型 
子 类 型 联系 时 ， 需 要 考虑 是 为 每 个 子 类 型 创建 独立 的 表 ， 还 是 将 它们 以 不 同方 式 进行 组 合 。 如 
果子 类 型 的 使 用 方式 类 似 ， 就 应 该 将 它们 组 合 起 来 。 而 如 果子 类 型 在 事务 、 查 询 和 报表 中 的 处 
理 方式 不 同 ， 就 应 该 考虑 将 超 类 型 实体 分 割 为 多 个 文件 。 当 一 个 关系 被 水 平分 割 时 ， 可 以 使 用 
SQL UNION 操 作 符 (在 第 7 章 中 介绍 ) 来 重建 ， 并 得 到 所 有 的 行 。 考 虑 前 面 的 例子 ， 当 需要 时 
可 以 看 到 所 有 的 顾客 数据 。 

Oracle 数 据 库 管理 系统 支持 多 种 形式 的 水 乎 分割 ， 这 主要 是 为 了 处 理 特别 大 的 表 而 设计 的 
(Brobst 等 ，1999)。 当 在 DBMS 中 使 用 SQL 数据 定义 语言 (第 7 章 中 会 介绍 相应 的 CREATE 
TABLE 命 令 ) 来 定义 表 时 ， 可 以 指定 表 的 分 割 。 在 Oracle 中 ，-- 个 表 可 以 有 多 个 分 割 。Oracle 
8; 提 供 三 种 水 平分 割 的 方法 : 

1) 键 范 围 分 齐 通过 为 规范 化 关系 的 一 个 或 多 个 字段 指定 值 的 范围 (上 下 界 ) 来 定义 分 割 。 
表 的 行将 会 根据 它 最 初 的 值 存放 到 正确 的 分 割 中 。 考 虑 到 分 割 键 值 遵循 一 定 的 模式， 所 以 每 个 
分 割 拥有 的 行 数 可 能 会 差别 很 大 。 数 据 库 设计 人 员 可 以 通过 指定 分 割 键 来 平衡 行 的 分 布 。 当 刍 
值 被 更 新 时 ， 可 以 限制 该 行 不 能 在 分 割 间 移动 。 

2) 散 列 分 审 ” 此 时 数据 被 平均 地 存放 在 分 割 中 ， 且 不 依赖 于 任何 用 于 分 割 的 键 值 。 散 列 分 
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割 克 服 了 键 范 围 分 割 可 能 产生 的 行 分 布 不 均 的 问题 。 

3) 复合 分 审 ” 这 是 键 范围 分 割 和 散 列 分 割 的 结合 。 对 于 数据 库 用 户 而 言 ， 分 割 可 以 是 透明 
的 (除非 用 户 希 望 将 某 个 查询 局 限 在 某 个 或 某 几 个 分 割 时 ， 才 需要 指明 )。 数 据 库 内 用 于 优化 
查询 的 模块 ， 会 为 查看 查询 涉及 的 表 的 分 割 定义 ， 并 在 检索 查询 结果 所 需 的 数据 时 自动 决定 是 
否 排除 那些 特定 的 分 割 。 这 会 显著 改善 查询 的 性 能 。 

例如 ， 我 们 在 键 范 围 分 割 中 使 用 事务 的 日 期 来 定义 分 割 。 一 个 要 查看 最 近 事务 的 查询 就 只 
需要 在 包含 最 近 事 务 的 一 个 或 几 个 分 割 上 进行 查找 ; 而 不 需要 扫描 整个 表 ， 甚 至 使 用 索引 在 没 
有 分 割 的 表 的 指定 范围 中 查找 行 。 依 照 日 期 定义 的 分 割 还 可 以 将 新 数据 的 插入 局 限 在 一 个 分 割 
上 ， 这 会 减少 数据 库 维 护 的 开销 ; 当 需 要 删除 旧事 务 数据 时 也 只 需要 删除 相应 的 分 割 。 在 分 割 
表 上 也 可 以 使 用 索引 ， 它 能 比 只 使 用 分 割 提供 更 好 的 性 能 。Brobst 等 (1999) 详细 讨论 了 使 用 
日 期 作为 键 范围 分 割 依据 的 优 缺 点 。 

在 散 列 分 割 中 , 行 平均 地 在 分 割 间 存储 。 如 果 分 割 可 以 存放 在 支持 并 行 处 理 的 存储 区 域 上 ， 
那么 与 对 单个 表 中 某 个 存储 区 域 的 数据 进行 顺序 访问 相 比 ， 会 大 大 提高 查询 的 效率 。 和 键 范围 
分 割 一 样 ， 散 列 分 割 相 对 于 查询 的 程序 员 来 说 也 可 以 是 透明 的 。 复 合 分 割 首 先 使 用 键 范围 来 定 
义 分 割 ， 然 后 在 得 到 的 分 割 上 再 进行 散 列 分 割 ， 从 而 得 到 子 分 割 ， 它 结合 了 键 分 割 的 优点 和 散 
列 分 割 良 好 的 并 行 处 理 能 力 。 

垂直 分 割 ”将 … 个 关系 的 列 分 布 到 几 个 单独 的 物理 记录 中 ， 此 时 关系 的 主键 在 每 个 物理 记 
录 中 重复 出 现 。 以 零件 关系 为 例 ， 它 可 以 被 垂直 分 割 为 账目 相关 、 工 程 相关 和 销售 相关 的 三 个 
记录 规格 说 明 ， 且 零件 号 必须 出 现在 每 个 记录 中 。 垂 直 分 割 的 优 缺 点 和 水 平分 割 类 似 。 当 所 有 
的 零件 数据 要 同时 使 用 时 ， 上 面 的 三 个 表 可 以 联结 起 来 。 和 水 平分 割 -一样 ， 垂 直 分 割 也 不 影响 
用 户 对 于 原始 的 整个 关系 的 使 用 。 

水 平分 割 和 垂直 分 割 也 可 以 结合 使 用 。 这 种 被 称 为 记录 分 割 【record partitioning ) 的 非 规 
范 化 形式 对 于 那些 文件 分 布 在 多 个 计算 机 上 的 数据 库 而 言 特别 常见 ， 我 们 会 在 第 13 章 中 对 此 进 
行 讨 论 。 

单个 的 物理 表 可 以 被 逻辑 地 分 割 ， 多 个 表 也 可 以 使 用 用 户 视图 的 概念 进行 逻辑 结合 〈 我 们 
会 在 第 7 章 中 讨论 用 户 视图 )。 利 用 用 户 视图 ， 用 户 会 感到 数据 库 内 除 物理 定义 的 表 以 外 ， 还 有 
其 他 的 表 ; 这 些 逻 辑 表 可 以 使 用 水 平 、 垂 直 分 割 和 其 他 的 非 规 范 化 方法 创建 。 然 而 ， 任 何 形式 
的 用 户 视图 ， 包 括 通过 视图 的 逻辑 分 割 ， 只 是 用 来 简化 查询 的 编写 并 使 数据 库 更 安全 ， 但 并 不 
能 提高 查询 性 能 。Oracle 提 供 了 一 种 称 为 分 割 视图 (partition view) 的 用 户 视图 。 在 分 割 视图 
中 ， 通 过 使 用 SQL UNION 操 作 符 ， 可 以 将 物理 上 分 离 但 是 具有 类 似 结构 的 表 逻 辑 地 结合 在 一 
起 。 这 种 形式 的 分 割 有 很 多 局 限 性 。 首先， 由 于 存在 着 多 个 单独 的 物理 表 ， 所 以 不 能 在 合并 后 
的 行 上 创建 全 局 索引 。 其 次 ， 每 个 物理 表 必 须 进行 单独 维护 ， 因 此 数据 维护 更 加 复杂 (比如 播 
入 新 行 时 ， 必 须 指 定 具 体 的 表 )。 最 后 ， 在 创建 更 高 效 的 查询 处 理 计划 时 ， 查 询 优化 器 处 理 分 
市 视图 的 选项 远 远 少 于 处 理 表 的 分 割 的 选项 。 

我 们 介绍 的 最 后 一 种 非 规范 化 是 数据 复制 。 在 数据 复制 中 ， 同 样 的 数据 被 故意 地 存放 在 一 
个 数据 库 的 多 个 地 方 。 以 图 6-1 为 例 ， 读 者 前 面 已 经 学 习 到 可 以 将 来 自 关联 实体 的 数据 和 组 成 
该 关联 的 简单 实体 的 数据 相 结 合 来 进行 反 规范 化 。 在 图 6-1 中 ，QUOTATION 的 数据 就 可 以 和 
PURCHASED PART 的 数据 存储 在 一 个 扩展 的 PURCHASED PART 物理 记录 规格 说 明 中 。 当 使 
用 数据 复制 时 ， 同 样 的 QUOTATION 数 据 可 以 和 与 其 相关 的 SUPPLIER 数 据 一 起 存储 在 新 的 扩 
展 SUPPLIER 物 理 记 录 规 格 说 明 中 。 使 用 这 样 的 数据 复制 方法 ， 只 要 检索 SUPPLIER 或 
PURCHASED PART 记 录 ， 相 应 的 QUOTATION 数 据 就 可 以 应 用 而 不 必 再 次 访问 二 级 存储 。 当 





和 盆 6 年 ”物理 烧 据 摩 人 夺 和 性 能 。 201 








然 仅 在 QUOTATION 数 据 总 是 和 SUPPLIER 或 PURCHASED PART 数 据 同时 使 用 ， 且 所 带 来 的 额 
外 存储 和 数据 维护 代价 不 大 时 ， 所 获得 的 性 能 改善 才 是 值得 的 。 


6.6 设计 物理 文件 


物理 文件 (physical file) 是 分 配 用 来 存储 物理 记录 的 一 部 分 已 命名 的 级 存储 (如 磁 
带 和 硬盘 )。 有 些 计算 机 操作 系统 将 物理 文件 分 成 称 为 区 的 块 来 存储 。 在 以 后 的 几 节 中 ， 我 
们 假设 物理 文件 没有 分 开 ， 且 文件 内 的 每 个 记录 有 相同 的 结构 。 我 们 会 讨论 如 何 将 一 个 数 
据 库 内 的 关系 表 的 行 存储 到 物理 空间 中 去 。 为 提高 数据 库 系统 处 理 的 性 能 ， 数 据 库 管 理 员 
通常 应 该 了 解数 据 库 系统 管理 物理 存储 的 具体 细节 。 虽 然 这 种 技术 是 与 具体 DBMS 相 关 的 ， 
但 是 我 们 在 以 后 几 节 中 所 讨论 的 原理 是 大 多 数 关系 数据 库 管理 系统 所 应 用 的 物理 数据 结构 
的 基础 。 

大 多 数 数据 库 管理 系统 将 多 种 类 型 的 数据 存放 在 单个 操作 系统 文件 中 ， 我 们 所 说 的 操作 系 
统 文件 就 是 指 在 磁盘 目录 列表 中 显示 的 有 名 文件 (比如 在 读者 个 人 电脑 的 C 盘 某 个 目录 下 的 文 
件 )。 在 Oracle 数 据 库 中 ， 物 理 存储 空间 的 一 个 重要 结构 是 表 空 间 。 一 个 表 空 间 (tablespace ) 
大 命名 的 一 组 磁盘 存储 单元 ， 它 用 来 存储 一 个 或 多 个 数据 库 表 的 数据 。Oracle 的 一 个 实例 会 包 
含 多 个 表 空 间 ， 例 如 一 个 表 空 间 用 来 存放 系统 数据 (数据 字典 或 关于 数据 的 数据 ) ， 一 个 表 空 
间 用 于 临时 工作 空间 ， 一 个 表 空 间 用 于 数据 库 恢 复 ， 其 他 一 些 表 空 间 用 来 存放 用 户 业 务 数据 。 
一 个 或 多 个 表 空 间 可 以 存放 在 一 个 物理 操作 系统 文件 中 。Oracle 负 责 管理 表 空 间 内 数据 的 存储 ， 
而 操作 系统 则 像 管 理 其 他 操作 系统 文件 一 样 为 表 空间 的 整体 提供 管理 (处 理 文件 层次 安全 性 、 
罕 间 分 配 、 处 理 磁盘 读 写 错误 )。 

由 于 一 个 Oracle 的 实例 通常 为 多 个 用 户 支 持 多 个 数据 库 ， 所 以 数据 库 管理 员 通 常 需要 创建 
多 个 用 户 表 空间 ， 并 给 用 户 在 各 个 表 空间 上 赋予 不 同 的 权限 以 保证 数据 库 安 全 。 如 上 面 所 介绍 
的 ， 作 为 一 个 操作 系统 文件 ， 表 空间 可 以 分 布 在 多 个 区 (extent) 上 ， 每 个 区 是 磁盘 存储 空间 
的 连续 扁 区 。 当 一 个 表 空 间 需 要 扩大 以 存储 更 多 数据 时 ， 系 统 就 会 为 它 分 配 另 一 个 区 。 每 一 个 
数据 库 的 表 被 存储 在 一 个 或 多 个 表 空 间 中 ( 表 的 一 行 只 存储 在 一 个 表 空间 中 ， 同 一 个 表 的 不 同 
行 可 以 存储 在 不 同 的 表 空 间 中 )。 一 个 表 空间 可 以 存储 一 个 或 多 个 表 的 数据 。 在 Oracle 环 境 中 ， 
管理 表 空 间 (或 物理 的 数据 库 文件 ) 是 数据 库 管理 员 的 重要 工作 。 例 如 ， 通 过 将 不 同 表 空间 分 
配 到 不 同 的 设备 上 ， 并 将 表 分 布 在 表 空 间 上 ， 数 据 库 管理 员 可 以 将 并 发 用 户 对 磁盘 争 用 减 到 最 
少 。 本 书 并 不 是 专门 讲授 Oracle 数 据 库 的， 所 以 我 们 不 详细 介绍 管理 表 空间 的 细节 。 然 而 在 
Oracle 数 据 库 中 设计 和 管理 表 空间 的 基本 原则 同样 适用 于 其 他 数据 库 管理 系统 的 物理 存储 单元 
管理 。 图 6-6 中 的 ERR 模 型 表明 在 Oracle 环 境 下 ， 物 理 数据 库 设计 所 涉及 的 多 个 物理 和 逻辑 数据 
库 术 语 之 间 的 关系 。 

6.6.1 指针 

在 文件 里 联结 一 块 数据 和 另 一 块 数据 从 而 将 所 有 文件 组 织 起 来 的 两 种 基本 结构 是 顺序 存储 
和 指针 。 在 顺序 存储 中 ， 一 个 字段 或 记录 紧 接 着 前 一 个 字段 或 记录 存储 。 虽 然 顺 序 存 储 易于 实 
现 和 使 用 ， 但 有 时 候 它 并 不 是 组 织 数据 最 有 效 的 方式 。 指 针 (pointer) 是 一 个 数据 字段 ， 它 用 
来 定位 一 个 相关 的 数据 字段 或 记录 。 在 大 多 数 情况 下 ， 指 针 包含 相关 数据 的 地 址 或 位 置 。 指 针 
可 以 在 多 种 数据 存储 结构 中 使 用 ， 我 们 在 本 章 中 会 介绍 其 中 的 一 些 存储 结构 。 有 兴趣 的 读者 可 
以 在 附录 C 中 找到 有 关 指 针 的 更 详细 的 介绍 。 我 们 在 这 里 只 定义 指针 ， 是 因为 了 解 指针 的 概念 
对 于 了 解 文件 组 织 至 关 重 要 。 通 常 来 说 ， 用 户 不 会 直接 使 用 指针 ， 因 为 数据 库 管理 系统 会 自动 
地 处 理 指针 的 使 用 和 维护 。 
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图 6-6 _ Oracle 环境 中 物理 文件 的 术语 


6.6.2 文件 组 织 

文件 组 织 (file organization) 是 在 二 级 存储 设备 上 物理 安排 文件 中 记录 的 技术 。 在 现代 关 
系数 据 库 管理 系统 中 ， 用 户 不 必 自 行 设计 文件 组 织 ， 而 是 可 以 为 表 或 物理 文件 选择 某 种 组 织 的 
形式 及 其 参数 。 在 为 数据 库 内 的 文件 选择 文件 组 织 时 ， 应 该 考虑 以 下 7 个 重要 因素 : 

1) 快速 的 数据 检索 。 

2) 处 理 数据 答 入 和 维护 事务 的 高 吞吐 量 。 

3) 存储 空间 的 高 效 使 用 。 

4) 防护 失效 和 数据 丢失 。 

5) 将 重新 组 织 的 需要 最 小 化 。 

6) 适应 增长 。 

7) 对 非 授权 访问 的 安全 控制 。 

通常 这 些 目 标 会 相互 冲突 ， 所 以 应 选择 一 种 文件 结构 ， 使 得 在 资源 范围 内 尽量 平衡 这 些 因 
素 。 在 本 章 中 ， 我 们 考虑 以 下 几 类 基本 的 文件 组 织 方法 : 顺序 文件 组 织 、 索 引文 件 组 织 和 散 列 
文件 组 织 。 图 6-7 以 一 些 大 学 运动 队 的 上 昵称 为 例 说 明 这 几 种 组 织 方式 。 

1. 顺序 文件 组 织 

在 一 个 顺序 文件 组 织 (sequential file organization) 中 ， 文 件 中 的 记录 按照 主键 值 依次 存储 
(参见 图 6-7a)。 要 定位 某 个 记录 ， 程 序 必须 从 头 到 尾 扫 描 文 件 直 至 找到 需要 的 记录 为 止 。 电 话 
筹 黄页 中 字母 序 人 名 列表 就 是 一 个 常见 的 硕 序 文件 (假设 目录 中 没有 其 他 索引 )。 表 6-3 中 比较 
了 上 顺序 文件 和 其 他 两 种 文件 的 功能 。 由 于 顺序 文件 的 方式 不 够 灵活 ， 所 以 数据 库 系 统 通常 并 不 
使 用 这 种 方式 ; 但 是 它 可 以 应 用 在 数据 库 备 份 数据 的 文件 上 。 
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2. 索 引文 件 组 织 

在 索引 文件 组 织 (indexed file organization ) 中 ， 记 录 可 以 用 顺序 或 非 顺序 的 方式 存储 ， 
系统 建立 索引 以 使 程序 可 以 定位 到 所 需 记录 (参见 图 6-7b)。 索 引 (index) 是 一 个 表 ， 可 以 用 
来 确定 文件 里 符合 某 些 条 件 的 行 的 位 置 ， 这 和 图 书馆 里 的 卡片 目录 一 样 。 索 引 的 每 一 项 将 一 个 
或 多 个 记录 与 键 值 匹配 起 来 。 索 引 可 以 只 定位 单个 记录 (主键 索引 ， 如 PRODUCT 记 录 的 
Product_ID 字 段 )， 也 可 以 定位 多 个 记录 。 一 个 允许 定位 多 个 记录 的 索引 称 为 辅 键 (secondary 
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a) 顺序 
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b) 案 引 的 
图 6-7 文件 组 织 的 比较 
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散 列 算法 













c) 散 列 航 
图 6-7 ( 续 ) 


key) 索引 。 辅 键 索引 可 以 支持 许多 报表 需求 ， 也 可 以 为 某 些 特 别 的 数据 检索 提供 快速 响应 。 
辅 键 索引 的 一 个 例子 是 PRODUCT 记 录 上 的 Finish 字 段 。 

一 些 索引 结构 会 影响 表 中 行 的 存储 位 置 ， 而 另 一 些 索引 和 行 的 存储 位 置 无 关 。 由 于 实际 的 索 
引 结构 不 影响 数据 库 的 设计 ， 对 数据 库 查 询 的 编写 也 不 重要 ， 所 以 我 们 不 在 本 章 中 讨论 索引 的 实 
际 物理 结构 。 因 此 图 6-7b 不 是 索引 结构 中 数据 存储 的 物理 视图 ， 而 是 一 个 使 用 索引 的 逻辑 视图 。 
某 些 关 系数 据 库 管理 系统 使 用 术语 主 索引 (primary index ， 不 同 于 主键 索引 (primary key index)) 
来 表示 决定 数据 物理 位 置 的 索引 ， 而 术语 辅 索引 (secondary index， 不 同 于 辅 键 索引 (secondary 
key index ) ) 表示 和 确定 数据 的 存储 位 置 无 关 的 索引 。 在 这 些 系 统 中 ， 一 个 表 可 以 有 一 个 主 索引 
和 多 个 辅 素 引 。 主 索引 可 以 使 用 表 的 主键 字段 ， 也 可 以 不 使 用 ; 辅 素 引 所 使 用 的 字段 值 在 行 间 可 
以 是 惟一 的 ， 也 可 以 不 惟一 。 当 使 用 术语 主 索 引 和 辅 索引 时 ， 有 以 下 4 种 索引 类 型 : 

“惟一 性 主 索引 (UPI) ”基于 惟一 性 的 字段 的 索引 ， 该 字段 可 以 是 表 的 主键 。 惟 一 性 主 索 

引 不 但 可 以 用 来 在 表 中 定位 具有 特定 值 的 行 ， 还 被 DBMS 用 来 决定 行 的 存储 位 置 。 

“ 非 惟 一 性 主 索 引 (NUPI) ”基于 非 惟一 性 的 字段 的 索引 。 这 个 索引 不 单 可 以 用 来 定位 具 
有 特定 值 的 行 ， 还 被 DBMS 用 来 决定 行 的 存储 位 置 。 

* 惟一 性 辅 索 引 (USI) ”基于 惟一 性 的 字段 的 索引 。 这 个 索引 只 用 来 定位 具有 特定 值 的 行 。 
* 非 惟一 性 辅 索引 (NUSI) ”基于 非 惟一 性 的 字段 的 索引 。 这 个 索引 只 用 来 定位 具有 特定 
值 的 行 。 

在 图 6-7b 的 例子 中 ， 在 索引 上 又 创建 索引 ， 构 成 一 个 有 层次 的 索引 集 。 索引 本 身 也 是 一 个 
文件 ， 当 索引 文件 很 大 时 ， 通 过 为 素 引 作 索引 也 是 一 种 可 行 的 组 织 方法 。 图 6-7b 中 的 每 个 索引 
项 都 包含 一 个 键 值 和 一 个 指向 其 他 索引 或 数据 记录 的 指针 。 例 如 ， 当 要 寻找 具有 键 值 “Flyers” 
的 记录 时 ,文件 组 织 会 从 顶部 的 索引 开始 ， 指 针 沿 着 F 项 向 下 寻找 。 该 指针 指向 其 他 包括 键 值 
开头 字母 从 A ~ F 的 索引 。 程 序 继 续 沿 着 指针 在 F 下 层 的 索引 中 寻找 指针 ， 它 会 指向 键 值 以 E 和 F 
开头 的 记录 。 最 终 通过 索引 ， 查 询 会 找到 所 需 的 记录 ， 或 是 报告 不 存在 这 样 的 记录 。 

索引 文件 组 织 的 一 个 重要 功能 是 可 以 创建 多 个 索引 。 在 图 书馆 里 ， 我 们 可 以 依据 书 名 、 作 
者 和 主题 为 同样 的 书 和 杂志 建立 多 个 索引 。 通过 在 同一 组 数据 上 创建 另外 的 索引 ， 我 们 构造 另 
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一 个 文件 。 在 这 个 文件 里 ， 只 包含 用 于 索引 的 字段 ， 而 大 多 数 数据 都 不 用 被 复制 。 多 个 索引 是 
可 以 被 使 用 的 。 比 如 ， 如 果 使 用 索引 Finish 去 寻找 那些 使 用 白桦 制作 的 产品 ， 而 使 用 索引 Cost 
去 寻找 那些 制造 成 本 少 于 500 美 元 的 产品 。 通 过 对 这 两 个 查询 结果 集 取 交 和 集 就 可 以 找到 那些 使 
用 白桦 ， 且 制造 成 本 少 于 500 美 元 的 产品 。 若 在 关系 数据 库 中 处 理 查 询 ， 那 么 在 一 个 查询 中 使 
用 多 个 索引 是 非常 重要 的 。 逻 辑 操 作 AND、OR 和 NOT 都 可 以 对 一 个 索引 扫描 的 结果 进行 再 处 
理 ， 避 免 访 问 不 满足 所 有 条 件 记录 所 产生 的 代价 。 

图 6-7b 中 的 层次 索引 结构 被 称 为 树 〈 根 结 点 在 上 ， 叶 结 点 在 下 ， 这 个 树 是 颠倒 的 )。 树 状 
索引 的 性 能 主要 取决 于 所 使 用 的 树 结构 的 性 质 ， 在 关系 数据 库 管理 系统 中 常常 使 用 的 树 的 类 型 
是 平衡 树 ， 即 B 树 ， 而 其 中 最 常见 的 形式 是 B+ 树 。 在 B 树 中 ， 所 有 的 叶子 (包括 数据 记录 或 指 
向 数据 记录 的 指针 ) 和 树 根 的 距离 都 是 相等 的 。 如 在 图 6-7b 中 ， 所 有 数据 记录 和 根 都 相差 两 级 。 
由 于 是 操作 系统 和 DBMS 决 定 使 用 何 种 索引 树 结构 ， 用 户 通常 对 索引 的 结构 没有 什么 选择 权 ， 
所 以 树 的 管理 对 数据 库 设计 人 员 和 开发 人 员 都 是 透明 的 。 附 录 C 中 将 会 讨论 有 关 树 的 数据 结构 
和 用 户 可 以 控制 的 一 些 树 的 参数 。 

位 图 索引 是 目前 使 用 越 来 越 广泛 的 一 种 索引 类 型 。 位 图 索引 (bitmap index， 参 见 图 6-8) 
使 用 位 图 来 管理 键 值 。 假 设 表 Product 有 10 行 ， 而 在 这 10 行 中 它 的 Price 属 性 有 4 个 不 同 的 取 值 。 
此 时 在 Price 字 段 上 的 位 图 索引 就 拥有 4 个 项 ， 而 每 个 项 包含 10 位 。 每 个 位 图 项 中 的 一 位 对 应 
Product 表 中 的 一 行 。 例 如 ， 在 price 为 400 美 元 的 位 图 中 ， 该 项 第 8 位 的 值 为 1。 这 就 表明 Produc' 
表 的 第 8 行 的 Price 值 为 400 美 元 (很 明显 ， 位 图 中 的 每 列 都 只 有 一 个 1)。 当 属性 的 可 能 值 非常 少 
时 ， 使 用 位 图 索引 比 常规 的 树 索引 更 加 理想 。 位 图 索引 通常 比 传统 的 树 索 引 占 用 更 少 的 空间 
(可 能 只 有 25% ，Schumacher，1997)。 当 然 如 果 一 个 属性 可 以 取 很 多 不 同 的 值 ， 那 么 位 图 索引 
就 可 能 比 树 索引 需要 更 多 的 空间 。 如 果 使 用 合理 ， 由 于 对 位 的 处 理 和 扫描 非常 快速 ， 所 以 基于 
位 图 索引 的 查询 可 以 比 基 于 常规 的 树 查询 快 10 倍 。 











注 : Products 3 和 5 的 Price 为 $100。 
Products 1 的 Price 为 $200。 
Products 2、7 和 10 的 Price 为 $300。 
Products 4、6、8 和 9 的 Price 为 $400。 


图 6-8 Product 表 中 Price 属 性 上 的 位 图 索引 


位 图 索引 的 一 个 有 趣 特性 是 它 可 以 在 多 个 键 上 使 用 。 比 如 ， 我 们 可 以 在 图 6-8 的 下 面 根据 
属性 Room 的 值 再 添加 行 。 此 时 ， 每 列 就 会 有 两 位 被 置 1; 一 位 对 应 于 Price ， 而 另 一 位 对 应 于 
Room。 如 有 果 要 查找 100 美 元 餐厅 使 用 的 产品 ， 就 可 以 将 分 别 对 应 的 两 行进 行 位 串 的 交 运 算 ， 这 
样 可 以 找到 符合 两 个 条 件 的 产品 。 这 样 的 位 操作 速度 是 非常 快 的 。 

事务 处 理 程序 需要 系统 对 涉及 几 张 表 中 少量 的 相关 联 行 查 询 的 快速 响应 。 比 如 ， 要 输入 一 
个 新 的 顾客 订单 ， 订 单 输入 程序 需要 在 顾客 表 中 找到 相应 的 顾客 ， 在 产品 表 中 找到 顾客 要 购买 


206 ”第 三 部 分 数据 府 雄 矿 





的 产品 ， 可 能 还 要 根据 顾客 的 要 求 查 询 有 关 产 品 特征 的 行 (比如 Product 的 Finish 属 性 )， 同 时 
在 相关 的 表 中 添加 顾客 订单 和 发 货 记录 。 我 们 在 前 面 讨论 到 的 索引 类 型 对 于 这 种 寻找 少量 特定 
行 的 应 用 程序 有 良好 的 支持 。 

另 一 种 越 来 越 流 行 的 索引 类 型 是 联结 索引 ， 在 数据 仓库 和 其 他 决策 支持 系统 中 (第 11 章 ) 
这 种 索引 更 为 流行 。 在 决策 支持 系统 中 ， 往 往 需 要 访问 与 其 他 表 相 联系 的 一 个 表 中 的 所 有 行 
(如 从 同一 家 商店 购物 的 所 有 用 户 )， 而 这 种 表 的 数据 量 通常 非常 大 。 联 结 索 引 (join index) 是 
在 来 自 于 多 个 表 的 列 上 创建 的 一 个 索引 ， 这 些 列 有 相同 的 值 域 。 比 如 ， 考 虑 图 6-9a 中 的 两 张 表 ， 
Store 和 Customer。 它 们 都 有 列 City， 在 City 上 的 联结 索引 会 表示 两 张 表 中 含有 相同 City 值 的 行 。 
由 于 有 许多 数据 仓库 ， 它 们 都 很 可 能 需要 查找 那些 处 于 同一 个 城市 的 商店 和 顾客 的 数据 (或 在 
多 个 维 之 间 的 类 似 关联 )。 图 6-9b 中 是 联结 索引 的 另 一 个 可 能 的 应 用 ， 它 预先 计算 表 Order 中 外 键 
和 表 Customer 中 主键 的 关联 。 联 结 索 引 预 先 计 算 关 系 中 联结 (join) 操作 的 结果 ， 该 内 容 在 第 7 
章 中 进行 讨论 。 简 而 言 之 ， 联 结 索 引 在 同一 张 表 或 不 同 的 表 里 寻 找 符合 某 些 要 求 的 值 所 在 的 行 。 


Customer 


ee | cee | oem | 
C2027 | Hadley Dayon 


Ruskin 上 
Ss 
Davies Toledo 
人 



















































RowID Manager 
S4266 K2 | E2166 
S2654 | Columbus | K3 E0245 

















注 :“ 这 一 列 可 以 根据 需要 被 包含 或 不 被 包含 。 联 结 索引 可 以 
在 三 列 中 的 任意 一 列 上 排序 。 某 些 时 候 可 以 创建 两 个 联结 索引 ， 
一 个 如 上 所 示 ， 另 一 个 则 将 两 个 rowID 的 列 交换 一 下 。 


a) 常见 非 键 列 上 的 联结 索引 
图 6-9 联结 索引 
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Order 





Order# Order Date 
O5532 10/01/2001 








O3478 10/01/2001 


= 二 











Customer 













CustName 


Baines Columbus 
| 

























b) 匹配 外 键 和 主键 的 联结 索引 
图 6-9 ( 续 ) 


联结 索引 在 行 被 加 载 人 数据 库 时 创建 ， 所 以 它 和 前 面 提 到 的 所 有 索引 一 样 ， 都 反映 数据 库 
的 最 新 信息 。 如 果 没 有 图 6-9a 中 的 联结 索引 ， 每 个 对 同一 个 城市 内 商店 和 顾客 的 查询 请 求 都 需 
要 重新 进行 和 联结 索引 相同 的 计算 。 由 于 在 两 个 很 大 的 表 之 间 进 行 联结 操作 是 相当 浪费 时 间 的 ， 
所 以 这 会 严重 影响 联机 查询 的 响应 速度 。 在 图 6-9b 中 ， 联 结 索 引 可 以 帮助 DBBMS 找 到 相关 的 行 
信息 。 联 结 索 引 和 其 他 的 索引 一 样 ， 它 们 都 是 通过 预先 查找 符合 某 些 条 件 的 数据 ， 来 加 快 查询 
的 效率 ， 其 代价 是 额外 的 存储 空间 和 索引 的 维护 。Bontempo 和 Saracco (1996) 的 著作 介绍 了 
如 何 将 联结 索引 和 位 图 索引 结合 使 用 以 加 快 某 些 特定 的 联结 索引 的 处 理 速度 。 

Ballinger ( 1999) 提出 一 种 联结 索引 的 扩展 方法 以 避免 对 实际 数据 表 的 访问 。 以 图 6-9b 为 
例 ， 除 Cust# 以 外 ， 还 可 以 将 其 他 一 个 或 两 个 表 中 的 字段 包含 进 联结 索引 中 。 这 样 当 使 用 联结 
索引 的 查询 只 需要 这 些 行 时 ， 就 不 再 需要 访问 原来 的 表 。 那 么 什么 时 候 应 该 使 用 这 种 联结 索引 
的 扩展 呢 ? 答 案 是 数据 库 是 相对 静态 ， 一 旦 创建 联结 索引 ， 就 会 有 相对 长 的 生命 周期 。 很 多 数 
据 仓 库 的 环境 是 满足 以 上 要 求 的 ; 在 这 些 数据 仓库 中 ， 已 经 存在 的 行 通常 不 会 再 修改 ， 可 能 以 
月 为 周期 进行 新 数据 的 添加 和 废弃 数据 的 删除 。 在 这 些 修改 不 频繁 ， 而 却 经 常 对 大 数据 表 进 行 
复杂 查询 的 数据 库 中 ， 对 联结 索引 进行 扩展 就 会 产生 良好 的 性 能 改善 。 
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一 些 新 兴 的 数据 库 应 用 (如 数据 仓库 、 联 机 决策 支持 系统 ) 对 于 数据 库 的 索引 提出 新 的 要 
求 。 我 们 在 这 里 建议 读者 仔细 研究 你 们 所 使 用 的 数据 库 管理 系统 中 的 索引 功能 ， 弄 请 楚 每 种 索 
引 的 适用 条 件 和 如 何 调整 索引 结构 的 性 能 。 

3. 散 列 文件 组 织 

在 一 个 散 列 文件 组 织 (hashed file organization ) 中 ， 每 个 记录 的 地 址 是 使 用 散 列 算法 来 决 
定 的 (参见 图 6-7c )。 散 列 算法 (hashing algorithm ) 是 一 个 将 记录 的 主键 值 转换 为 记录 地 址 的 
程序 。 虽 然 有 许多 散 列 文件 的 变 体 ， 但 是 在 大 多 数 情况 下 ， 使 用 散 列 算法 的 记录 不 是 顺序 存放 
的 ， 也 就 不 适用 于 顺序 的 数据 处 理 。 

一 个 典型 的 散 列 算法 是 将 每 个 主键 值 除 以 一 个 素数 ， 并 使 用 余数 作为 相对 的 存储 位 置 。 比 
如 ， 假 设 一 个 组 织 中 有 1000 条 员工 的 记录 存放 在 磁盘 上 。 此 时 合适 的 素数 可 以 是 997 ， 因 为 它 
和 1000 很 接近 。 现 在 考虑 员工 12396， 我 们 把 这 个 值 除 以 997 后 得 到 的 余数 是 432， 因 此 这 条 记 
录 就 存放 在 文件 的 位 置 432。 必 须 使 用 其 他 技术 (这 里 不 讨论 ) 来 处 理 重复 (溢出 ) 的 情况 ， 
内 为 有 多 个 键 值 取得 的 余数 可 能 相同 ( 称 为 散 列 冲突 )。 

散 列 文件 组 织 的 一 个 严重 缺陷 是 ， 由 于 数据 行 的 存储 位 置 是 由 散 列 算法 决定 的 ， 因 此 基于 
散 列 进行 数据 读 取 时 只 能 应 用 一 个 键 。 散 列 可 以 和 索引 相 结合 构成 散 列 索引 表 来 解决 这 一 问题 。 
散 列 索引 表 (hash index table) 使 用 散 列 算法 来 将 键 映 射 到 索引 表 (有 时 被 称 为 分 散 索引 表 ) 
中 的 一 个 位 置 ， 该 位 置 存放 着 一 个 指向 实际 对 应 散 列 键 的 数据 记录 的 指针 。 散 列 算法 的 结果 是 
索引 的 存放 地 址 ， 而 实际 的 数据 存放 在 另外 的 位 置 。 由 于 散 列 算法 的 结果 是 索引 表 中 的 位 置 ， 
表 的 行 可 以 独立 于 散 列 地 址 而 存放 ， 因 此 就 可 以 使 用 任何 其 他 的 文件 组 织 方 法 (比如 顺序 或 首 
个 可 用 空间 方法 )。 和 其 他 索引 方法 类 似 ， 但 不 同 于 纯粹 的 散 列 方法 ， 此 时 可 以 使 用 多 个 主键 
和 辅 键 ， 并 为 每 一 个 键 定义 自己 的 散 列 算法 和 索引 表 ， 共 享 实际 的 数据 表 。 同 时 由 于 索引 表 比 
数据 表 小 得 多 ， 可 以 很 容易 地 设计 索引 以 减少 键 冲 突 和 溢出 的 可 能 性 。 显 然 此 时 索引 的 额外 空 
间 和 维护 成 本 ， 会 带 来 更 大 的 灵活 性 和 更 快 的 数据 检索 速度 。 在 一 些 使 用 并 行 处 理 的 数据 仓库 
中 ， 散 列 索引 表 也 被 利用 。 此 时 DBMS 将 表 的 数据 平均 分 配 在 存储 设备 上 ， 并 将 任务 公平 地 分 
配给 多 个 并 行 处 理 器 ， 然 后 使 用 散 列 和 索引 来 快速 定位 所 需 的 数据 存放 在 哪个 处 理 器 。 

使 用 索引 技术 需要 注意 的 问题 是 数据 一 旦 存储 以 后 的 移动 数据 的 困难 性 。 如 果 需 要 移动 一 
个 行 ， 所 有 索引 中 指向 它 的 指针 都 必须 被 更 新 。 如 果 频 繁 地 重新 组 织 数据 (这 是 由 于 频繁 删除 
行 在 为 数据 行 所 保留 的 物理 文件 中 产生 浪费 空间 或 空洞 而 造成 的 ) ， 这 就 会 是 一 个 很 大 的 开销 。 
男 一 方面 ， 纯 粹 的 散 列 方 法 不 允许 移动 数据 ， 除 非 是 在 处 理 溢出 的 情况 下 。 而 散 列 索 引 表 的 方 
法 能 根据 多 键 值 进行 数据 快速 读 取 和 移动 数据 的 能 力 ， 其 缺点 是 更 新 索引 的 额外 开销 ， 尤 其 当 
数据 空间 被 重新 组 织 变 得 很 重要 时 。 

正如 前 面 所 说 ,DBMS 可 以 处 理 所 有 有 关 散 列 文件 的 管理 问题 。 用 户 不 需要 关心 如 何 处 理 
溢出 ， 如 何 访问 索引 或 是 具体 的 散 列 算 靶 。 作 为 一 个 数据 库 设计 人 员 ， 重 要 的 是 了 解 不 同文 件 
组 织 的 特性 ， 以 便 为 所 设计 的 数据 库 系统 和 所 开发 的 程序 选择 最 适当 的 数据 库 处 理 类 型 。 同 样 ， 
了 解 DBMS 使 用 的 文件 组 织 的 性 质 ， 可 以 帮助 程序 人 员 书 写 能 够 有 效 地 利用 文件 组 织 性 质 的 查 
询 语句 。 正 如 读者 将 在 第 7 章 和 第 8 章 看 到 的 那样 ， 很 多 查询 都 可 以 有 多 种 方法 用 SQL 语 句 来 书 
写 ; 但 是 不 同 的 查询 语 名 会 导致 DBMS 使 用 完全 不 同 的 步骤 来 处 理 查询 。 如 果 用 户 知 道 DBMS 
使 用 文件 组 织 的 方法 〈 使 用 什么 索引 ， 何 时 、 如 何 使 用 散 列 算法 ) ， 就 会 设计 出 更 好 的 数据 库 ， 
编写 出 效率 更 高 的 查询 语句 。 

6.6.3 文件 组 织 小 结 
前 面 介绍 的 三 类 文件 组 织 涵盖 了 用 户 在 进行 物理 文件 和 数据 库 设 计时 ， 可 以 使 用 的 大 部 分 
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文件 组 织 形 式 。 虽 然 可 以 使 用 附录 C 中 列举 的 数据 结构 构造 更 复杂 的 结构 ， 但 是 通常 在 DBMS 
中 不 使 用 这 种 复杂 的 结构 。 

表 6-3 总 结 了 顺序 、 索 引 和 散 列 文件 组 织 的 特点 。 读 者 可 以 利用 图 6-7 来 对 表 中 的 特点 进行 
今 证。 


表 6-3 不 同文 件 组 织 的 特点 比较 





因素 顺序 文件 组 织 索引 文件 组 织 散记 文件 组 织 
存储 空间 不 浪费 空间 不 增加 数据 存储 空间 .但 是 在 最 初 记录 被 导入 后 ， 需 要 额外 
需要 索引 的 额外 存储 罕 间 的 空间 以 支持 记录 的 添加 和 删除 
对 王 键 的 顺序 检索 非常 快 中 等 速度 不 能 实现 ， 除 非 使 用 散 列 索引 
对 主键 的 随机 伶 索 不 能 实现 中 等 速度 非常 快 
对 多 个 键 值 的 检索 可 以 ， 但 是 需要 扫描 ”使 用 多 个 索引 时 非常 快 不 能 实现 ， 除 非 使 用 散 列 索引 
整个 文件 
删除 记 半 可 能 造成 空间 浪费 ， 当 支 持 空间 动态 分 配 时 可 以 非常 容易 
或 者 需 归 重新 组 织 实现 . 但 是 需要 维护 索引 
涂 加 新 记录 需要 重 写 文 件 当 支 持 空 间 动态 分 配 时 可 以 非常 容易 ， 但 当 多 个 键 对 应 一 
实现 、 但 是 需要 维护 索引 个 地 址 时 需要 额外 的 工作 
更 新 记 寺 通常 需要 重 守 文件 容易 、 但 是 需要 维护 索引 很 容易 
6.6.4 聚 徐 文件 


一 些 数据 库 管理 系统 支持 使 用 邻接 的 二 级 存储 来 存放 不 同 表 的 行 ， 这 时 一 个 物理 文件 中 的 
记录 结构 就 可 能 不 同 。 例 如 在 Oracle 数 据 库 中 ， 来 自 于 一 个 、 两 个 或 多 个 相关 表 的 经 常 进行 联 
结 操作 的 行 可 以 存储 在 相同 的 磁盘 区 域 。 一 个 聚 敌 (cluster) 是 通过 表 和 表 之 间 经 常 进行 联结 
操作 的 列 来 定义 的 比如 表 Customer 可 能 经 常 和 表 Customer_Order 在 字段 Customer - ID 上 联结 ， 
Customer_Order 可 能 和 表 Price_Quote (包含 从 供 货 商 处 购买 的 标准 件 的 价格 ) 在 ftem_fd 上 联结 ， 
和 在 磁盘 上 不 同 区 域 存储 不 同文 件 的 方式 相 比 ， 聚焦 可 以 显著 地 加 快 访问 相关 记录 的 速度 ， 这 
时 因为 相关 的 记录 在 物理 上 就 很 接近 ， 自 然 比 将 记录 存储 在 不 同 磁盘 区 域 的 不 同文 件 中 速度 要 

快 得 多 。 将 某 个 表 定 义 到 单一 的 育 往 上 ， 只 会 影响 定义 在 相同 聚 入 上 的 那些 表 的 存 取 性 能 。 
下 面 的 Oracle 数 据 定义 命 令 说 明 如 何 定义 聚 入 ， 以 及 如 何 将 表 指 定 到 聚 秘 上 。 如 下 例 所 示 ， 
首先 指定 聚 得 ( 邻接 的 磁盘 空间 ): 


CREATE CLUSTER ORDERING (CLUSTERKEY CHAR(25)); 


ORDERING 是 聚 比 空间 的 名 字 ，CLUSTERKEY 是 必须 的 但 不 会 再 次 使 用 。 
当 表 被 创建 时 ， 就 被 指定 在 吝 徐 上 ， 如 : 
CREATE TABLE CUSTOMER'( 

CUSTOMER_ID VARCHAR2 (25) NOT NULL, 

CUSTOMER ADDRESS VARCHAR2(15) 

) 

CLUSTER ORDERING (CUSTOMER ID); 


CREATE TABLE ORDER( 


ORDER_ID VARCHAR2(20) NOT NULL, 
CUSTOMER_ ID VARCHAR2(25) NOT NULL, 
ORDER DATE DATE 


) 
CLUSTER ORDERING (CUSTOMER ID); 


在 Oracie 中 ， 访 问 罕 焦 记录 可 以 通过 聚 簇 键 的 索引 或 是 聚 艇 键 的 散 列 函 数 。 选 择 索引 或 是 
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选 树 散 列 的 理由 和 前 面 提 到 的 选择 索引 文件 和 散 列 文件 类 似 ( 表 6-3)。 最 好 在 记录 相对 静态 的 
情况 下 聚 秘 记录 ， 如 果 记 录 经 常 被 添加 、 删 除 或 是 修改 ， 就 可 能 导致 空间 的 浪费 ， 也 会 使 在 首 
次 加 载 后 再 将 相关 记录 靠近 在 临近 位 置 的 工作 变 得 困难 。 聚 簇 是 设计 人 员 用 来 改善 那些 经 常 在 
查询 和 报表 中 一 起 使 用 的 表 的 性 能 的 一 种 方式 。 
6.6.5 设计 文件 控制 

关于 数据 库 文件 设计 的 另 一 个 方面 是 对 于 文件 的 控制 ， 它 用 来 防止 文件 被 破坏 或 污染 ,或 
是 在 文件 被 损坏 后 重 构 它 。 数 据 库 文件 是 以 DBMS 所 专 有 的 文件 格式 存储 的 ， 这 是 一 种 基本 层 
次 的 访问 控制 。 用 户 可 能 希望 对 字段 、 文 件 和 数据 库 提供 额外 的 安全 控制 。 在 第 8 章 和 第 12 章 
中 ， 我 们 会 介绍 一 些 可 行 的 方法 。 简 而 言 之 ， 文 件 可 能 被 损坏 ， 所 以 最 重要 的 是 快速 恢复 被 损 
坏 的 文件 。 利 用 备份 过 程 可 以 提供 文件 和 对 文件 进行 修改 的 事务 的 一 个 副本 。 当 一 个 文件 损坏 
上 时， 可 以 利用 文件 的 副本 和 事务 的 日 志 来 将 它 恢复 到 一 个 正确 的 状态 。 在 安全 性 方面 ， 最 有 效 
的 策略 是 加 密 文件 的 内 容 ， 这 样 就 只 有 那些 知道 解密 过 程 的 程序 才 可 以 看 到 文件 内 容 。 在 第 8 
章 中 我 们 讨论 关系 数据 操纵 语言 SQL 和 在 第 12 章 中 介绍 关于 数据 活动 和 数据 库 管理 的 内 容 时 ， 
会 涉及 这 些 重要 的 课题 。 


6.7 索引 的 使 用 和 选择 


大 多 数 的 数据 库 操纵 需要 定位 满足 某 个 条 件 的 一 行 (或 多 行 )， 比 如 需要 读 取 有 具有 某 个 邮 
政 编码 的 所 有 顾客 或 是 特定 专业 的 全 体 学 生 。 在 实际 的 数据 库 应 用 中 ， 由 于 数据 库 的 表 通 常 很 
大 ， 所 以 对 表 进 行 扫描 以 定位 需要 的 行 往往 需要 很 长 的 时 间 。 使 用 前 面 所 介绍 的 索引 可 以 大 大 
加 快 这 一 过 程 ， 因 此 定义 索引 是 物理 数据 库 设 计 的 重要 部 分 。 

在 前 面 几 节 关 于 索引 的 讨论 中 ， 读 者 已 经 知道 索引 可 以 创建 在 主键 或 (和) 辅 键 上 ， 通 常 
情况 下 会 为 表 的 主键 创建 索引 。 索 引 自身 也 是 一 张 表 ， 它 包含 有 两 列 ， 键 和 包含 该 键 值 的 记录 
或 记录 组 地 址 。 对 于 为 主键 创建 的 索引 而 言 ， 每 一 个 键 值 所 对 应 的 记录 地 址 都 是 惟一 的 ， 
6.7.1 创建 惟一 键 索引 

前 面 提 到 的 定义 在 诊 答 上 的 表 Customer 有 主键 Customer_ID ， 可 以 使 用 下 面 的 SQL 语句 为 
这 个 字段 创建 惟一 的 键 索 引 : 

CREATE UNIQUE INDEX CUSTINDEX ON CUSTOMER (CUSTOMER_ ID) ; 

在 这 个 语句 中 ，CUSTINDEX 是 用 来 存放 索引 项 的 索引 文件 名 ; ON 子 句 指定 为 哪个 表 创 建 
索引 以 及 组 成 索引 键 的 列 〈 列 组 )。 当 这 条 命令 执行 时 ， 所 有 Customer 表 中 已 有 的 记录 都 会 被 
索引 。 如 果 表 中 存在 重复 的 Customer_ID 值 ， 则 该 命令 会 失败 。 在 索引 创建 后 ，DBMS 会 拓 绝 
一 切 违 反 Customer_ID 惟 一 性 约束 的 数据 插入 和 修改 操作 。 

ON 子 句 也 可 以 用 来 定义 复合 的 惟一 键 ， 此 时 需要 列 出 该 键 的 所 有 组 成 元 素 。 比 如 在 一 个 
有 关 顾 客 订单 的 表 上 ，Order_ID 和 Product_ID 组 成 一 个 复合 的 惟一 键 ， 可 以 使 用 下 面 的 SQL 语 
句 来 为 表 Order_Line 创 建 索引 : 

CREATE UNIQUE INDEX LINEINDEX ON ORDER_LINE (ORDER_ID, PRODUCT ID) ; 

6.7.2 创建 辅 键 索引 

数据 库 用 户 经 常 需要 在 关系 中 根据 属性 值 (而 非 主 键 值 ) 来 读 取 特 定 行 。 例 如 ， 在 Product 
表 中 ， 用 户 可 能 希望 选取 满足 下 列 条 件 任 意 组 合 的 记录 : 

“所 有 的 桌子 产品 (Description = “Table') 

“所 有 的 橡木 家 具 (Finish = “Oak” ) 

“所 有 的 餐厅 家 具 (Room= ‘DR'’) 
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“所 有 价格 低 于 5$00 美 元 的 家 有 具 (Price < 500) 

为 加 快 类 似 查 询 的 读 取 速度 ， 我 们 可 以 为 使 用 到 的 每 个 属性 创建 索引 。 比 如 ， 我 们 可 以 用 
以 下 命令 在 表 Product 的 Description 字 段 上 创建 一 个 非 惟一 的 索引 : 

CREATE INDEX DESCINDX ON PRODUCT (DESCRIPTION); 

请 注意 ， 没 有 使 用 UNIQUE， 这 是 因为 对 于 辅 键 来 说 ， 属 性 的 值 是 可 以 重复 的 。 和 惟一 键 
索引 一 样 ， 辅 键 索 引 也 可 以 创建 在 属性 的 组 合 上 。 

可 以 使 用 类 似 的 命令 结构 来 创建 位 图 索引 ， 用 户 可 以 通过 以 下 的 语句 为 Description 字 段 创 
建 位 图 索引 : 

CREATE BITMAP INDEX DESCBITINDX ON PRODUCT (DESCRIPTION) ， 
6.7.3 何 时 使 用 索引 

在 物理 数据 库 设 计 中 ， 必 须 确定 创建 索引 的 属性 ， 这 需要 在 索引 带 来 的 性 能 改善 和 记录 的 
插入 、 删 除 以 及 修改 的 额外 开销 间 取 得 平衡 。 对 于 主要 工作 是 数据 读 取 的 系统 ， 如 决策 支持 和 
数据 仓库 应 用 等 ， 应 该 尽量 地 使 用 索引 。 而 对 于 主要 工作 是 支持 事务 处 理 ， 有 大 量 的 数据 修改 
请 求 的 系统 ， 应 该 谨慎 地 使 用 索引 ， 因 为 此 时 索引 会 带 来 额外 的 开销 。 

下 面 是 一 些 在 关系 数据 库 中 选择 索引 的 经 验 : 

1) 在 大 的 数据 表 上 ， 索 引 的 效果 特别 突出 。 

2) 为 每 个 表 的 主键 创建 一 个 惟 -- 索 引 。 

3) 那些 经 常 出 现在 SQL 查询 WHERE 子 名 的 列 比较 适 于 创建 索引 ， 它 们 可 能 用 来 限定 行 ( 比 
如 WHERE FINISH= 'Oak ， 此 时 Finish 字 段 上 的 索引 会 加 快 读 取 速 度 )， 也 可 能 用 来 在 表 间 作 联 
结 (比如 WHERE PRODUCT.PRODUCT_ID = ORDER_LINE.PRODUCT_ID， 此 时 为 表 Order_ 
Line 在 字段 Product_ID 创 建 辅 键 索引 ， 为 表 Product 的 主键 Product_ID 创 建 主键 索引 会 改善 存 取 的 
性 能 )。 在 后 一 种 情况 中 ， 可 以 看 到 索引 创建 在 用 于 和 其 他 表 联 结 的 表 Order_Line 的 外 键 上 。 

4) 为 那些 在 ORDER BY (排序 ) 和 GROUP BY (分 类 ) 中 使 用 的 属性 建立 索引 。 需 要 特 
别 注意 这 种 情况 ， 要 确定 DBMS 是 否 会 使 用 子 句 中 列 出 的 这 些 属性 上 的 索引 (比如 Oracle 会 使 
用 ORDER BY 属性 上 建立 的 索引 ， 但 不 会 使 用 GROUP BY 属性 上 的 索引 )。 

5) 如 果 某 个 属性 的 可 选 值 很 多 ， 应 该 为 它 创 建 索引 。Oracle 的 建议 是 ， 如 果菜 个 属性 的 不 
辣 值 少 于 30 个 ， 则 索引 的 用 处 不 大 ; 而 如 果 属 性 的 不 同 值 多 于 100 个 ， 则 索引 的 效果 很 明显 。 
间 样 的 道理 ， 只 有 当 查 询 到 的 记录 数 不 多 于 文件 中 所 有 记录 数 的 20% 时 ， 索 引 才 是 有 益 的 
(Schumacher，1997 ) 。 

6) 检查 DBMS 中 可 能 有 的 对 于 一 个 表 上 索引 数目 的 限制 . 很 多 系统 要 求索 引 数 不 多 于 16 个 ， 
并 对 索引 的 键 值 大 小 有 限制 (比如 每 个 复合 键 值 不 多 于 2000 字 节 )。 如 果 系 统 中 存在 着 类 似 的 
限制 ， 就 必须 选择 那些 对 于 系统 性 能 改善 贡献 最 大 的 辅 键 索引 。 

7) 当 为 含有 空 值 的 属性 创建 索引 时 ， 需 要 特别 注意 。 在 很 多 DBMS 中 ， 含 有 空 值 的 行 不 会 
在 索引 中 引用 (所 以 它们 不 会 在 类 似 于 ATTRIBUTE = NULL 的 索引 搜索 中 找到 )。 类 似 的 查询 
需要 扫描 文件 才能 完成 。 

如 何 选取 索引 是 物理 数据 库 设 计 中 最 重要 的 决定 ， 但 还 存在 其 他 可 以 改善 数据 库 系统 性 能 
的 方法 。 其 他 的 方法 可 以 处 理 以 下 问题 : 减少 记录 重新 定位 记录 的 代价 ， 优化 文件 中 空余 空间 
的 使 用 ， 以 及 优化 查询 处 理 的 算法 (参见 Viehman，1994， 有 关于 使 用 这 些 其 他 方法 来 改善 物 
理 数 据 库 设计 的 讨论 )。 我 们 会 在 后 面 的 小 节 中 简要 地 介绍 有 关 查 询 优 化 的 问题 ， 因 为 类 似 的 
优化 可 以 被 用 来 修正 使 用 数据 库 系统 的 一 些 设计 选项 的 方式 ， 这 些 设计 选项 在 大 多 数 情 况 下 对 
于 提高 数据 处 理 的 性 能 是 有 益 的 。 





6.8 RAID: 通过 并 行 处 理 来 改善 文件 访问 的 性 能 


在 本 章 的 前 面 几 节 中 ， 读 者 已 经 学 习 了 如 何 通 过 非 规 范 化 和 聚 铸 来 让 经 常 一 起 使 用 的 数据 在 
内 存 中 彼此 接近 。 如 果 在 程序 中 一 起 使 用 的 数据 可 以 保存 在 一 个 物理 的 数据 页 上 ， 那 么 非 规范 化 
和 育 敌 会 有 效 地 减少 数据 访问 所 需 的 时 间 。 对 于 小 记录 ， 类 似 的 要 求 通常 是 可 以 满足 的 。 但 是 需 
要 一 起 或 连续 使 用 的 数据 可 能 被 存放 在 多 个 单独 的 页 上 。 在 这 种 情况 下 ， 读 写 这 些 数据 需要 多 次 
顺序 的 磁盘 输入 /输出 操作 。 此 时 非 规 范 化 和 聚 簇 就 无 法 为 改善 数据 的 读 写 性 能 提供 太 大 的 帮助 。 

计算 机 技术 发 展 的 两 个 必然 趋势 是 价格 越 来 越 低 ， 所 占 空间 越 来 越 小 ， 这 使 得 计算 机 组 件 的 
元 余 和 相应 的 容错 在 物理 上 和 经 济 上 都 变 得 可 行 。 使 用 多 个 小 的 计算 机 组 件 也 给 数据 的 并 行 处 理 
提供 帮助 。 数 据 并 行 处 理 的 效果 相当 显著 ， 例 如 当 使 用 并 行 处 理 时 ，4 次 输入 /输出 操作 所 耗费 的 
时 间 相 当 于 1 次 操作 的 时 间 。 这 种 特性 对 于 电子 商务 这 样 的 联机 超大 型 数据 库 系统 非常 重要 。 

数据 库 设计 人 员 可 以 使 用 硬件 或 称 为 廉价 元 余 磁 盘 阵 列 (Redundant Array of Inexpensive 
Disk，RAID ) 软件 技术 来 实现 并 行 的 数据 库 处 理 和 容错 。 在 RAID 中 使 用 一 组 物理 磁盘 ， 对 于 
数据 库 用 户 (以 及 程序 ) 而 言 ， 它 们 就 好 像 是 一 个 大 的 逻辑 存储 单元 。 因 此 RAID 并 不 会 改变 
应 用 程序 和 数据 库 查 询 的 逻辑 或 物理 结构 。 

为 了 使 RAID 的 输入 /输出 性 能 达到 最 优 ， 就 必须 使 所 有 的 磁盘 都 投入 工作 。 分 条 (striping) 可 
以 实现 工作 负载 在 磁盘 上 的 平衡 。 如 图 6-10 所 示 ， -个 逻辑 磁盘 对 动 器 
称 为 条 (stripe) 的 数据 段 跨越 所 有 的 磁盘 。 逻 辑 上 连 | J 
续 的 数据 页 (例如 ， 一 个 记录 占据 的 多 个 页 ， 记 | | | 
录 的 聚 乱 ， 一 个 文件 里 逻辑 上 的 顺序 记录 ) 在 物 一 一 一 





磁盘 1 磁盘 2 磁 租 3 磁盘 4 
































、 、 | ， | 条 
理 磁盘 上 以 循环 的 方式 存储 。 以 图 6-10 中 假定 的 | ri 2 上 上 3 二 | 和 和- 
RAID 存 储 为 例 ， 就 可 能 只 需要 读 取 1 页 的 时 间 来 5 | 7 8 | 条 
读 取 远 辑 顺 序 的 4 页 。 在 RAID 中 读 取 一 个 存放 在 | | TT i 
多 个 物理 页 中 的 非常 大 的 数据 记录 (可 能 包含 音频 、 | -|- -+1- 二 -上 +- i 
视频 )， 可 能 只 需要 原来 几 分 之 一 的 时 间 。 分 布 在 
多 页 上 的 相关 记录 ( 聚 徐 ) 可 以 在 同时 一 次 读 取 。 。 。 。 

大 多 数 现在 的 多 用 户 操作 系统 (如 Microsoft 

NT、UNIX 和 Novell Netware) 都 支持 某 种 形式 的 ” ” ” 
RAID。 这 些 操作 系统 可 以 进行 并 行 的 读 取 操作 ， 一 
并 将 得 到 的 结果 联结 成 一 个 逻辑 记录 返回 给 需要 | | 
的 程序 。 这 些 系统 也 支持 多 线程 ， 允 许多 个 不 同 并 行 读 | 
的 用 户 程序 或 任务 同时 发 出 读 / 写 请 求 。RAID 也 注 :“ 还 畔 顺序 的 页 在 辜 胡 上 交错 。 
可 以 使 用 特殊 的 示 配 器 在 硬件 中 实现 ， 这 样 就 不 图 6-10 使 用 4 个 磁盘 和 分 条 的 RAID 


再 需要 由 操作 系统 来 将 输入 /输出 请 求 分 解 为 可 并 行 的 步骤 。 

RAID 有 一 个 极 大 的 危险 : 可 能 增加 整个 数据 库 内 磁盘 失败 的 机 会 。 如 果 一 个 磁盘 平均 在 
120 万 次 操作 后 出 现 一 次 错误 ， 则 采用 4 个 磁盘 的 RAID 就 会 在 30 万 次 操作 后 平均 出 现 一 次 错误 。 
为 解决 这 个 问题 并 使 磁盘 存储 可 以 容错 ， 很 多 类 型 的 RAID 技 术 宛 余地 存储 数据 ， 这 样 就 保证 
至 少 有 一 个 数据 副本 是 可 用 的 ，RAID 也 常常 使 用 差错 校 验 码 来 恢复 损坏 和 于 失 的 数据 。 
选择 RAID 的 层次 

一 个 文件 和 数据 库 的 设计 者 可 能 拥有 六 种 或 更 多 的 可 供 选 择 的 RAID 体 系 架构 ， 它 们 提供 
元 余 存储 或 差错 矫正 。 虽 然 RAID-0 不 提供 宛 余 存储 ， 但 是 它 最 大 限度 地 利用 并 行 化 ， 可 以 提 
供 最 价 的 性 能 。 图 6-11 比 较 了 六 种 形式 的 RAID 和 它们 的 一 些 关键 特性 。 不 同 的 磁盘 和 操作 系 
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统 可 能 会 提供 其 他 的 方案 。 


[I 1 


隘 委 1 磁盘 2 位 盘 3 幅 矢 4 


。 将 所 有 的 磁 委 用 于 数据 存储 

*。 最 大 限度 的 并 行 访 问 ， 因 而 访问 
时 间 很 快 

。 没有 守 余 和 错误 校 验 

。 只 有 单线 程 1O 

“适用 于 很 大 的 记录 、 很 多 相关 的 
记 寻 和 和 需 昌 大 是 LO 操 作 的 应 用 
( 如 临时 存储 空间 和 索引 空间 ) 

















a) RAID-0 (分 条 ) 


* 磁盘 存储 空间 利用 率 只 有 一半. 
但 是 具有 容错 的 优点 

“每 个 写 操 作 都 是 丈 余 的 ， 和 写本 以 
在 磁 稚 对 上 并 行 地 进行 〈 节 好 完 
余 的 磁盘 在 不 同 的 磁盘 控制 器 上 ) 
*， 读 操作 可 以 在 所 有 的 磁盘 上 并 行 
地 进行 

。 适 用 于 大 记录 和 需要 大 量 1O 操 作 
的 应 用 《比如 恢复 日 志文 件 或 是 
需要 随机 读 写 和 顺序 读 写 相 混 合 
的 文件 ) 











放行 读 





b) 带 有 两 对 镜像 磁盘 的 RAID-1 







每 次 写 跨越 所 有 磁盘 


磁盘 1 磁盘 2 磁盘 3 磁盘 4 
“每 个 数据 记录 分 布 在 所 有 的 数据 
磁盘 

* 一些 磁 盘 地 门 用 来 存放 错误 校 验 


码 (ECC) 
“每 个 写 操 作 并 行 地 使 用 所 有 磁盘 
“每 个 读 操作 并 行 地 使 用 所 有 磁盘 





读 跨越 所 有 数据 磁盘 
c) -- 半 的 磁盘 用 来 存放 数据 的 RAID-2 
图 6-11 6 个 层次 的 RAID (注意 : 数字 是 顺序 数据 块 号 ， 字 母 表 示 数 据 块 的 段 ) 


213 
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有 条 三 部 分 


磁 











数据 详 讼 矿 


每 次 写 跨 越 所 有 磁盘 
盘 1 做 盘 2 磁盘 3 磁盘 4 


* 征 个 数据 记录 可 以 分 布 在 所 有 的 数据 
磁 和 基 、 或 者 将 单独 的 记录 放 在 :个 条 
中 

“一 个 克 盘 被 去 门 用 来 存储 错误 校 验 码 
( 比 RAID-2 有 有 更 多 的 数据 存储 空间 ) 

*。ECC 用 来 恢复 条 内 损坏 的 数据 或 做 让 


“每 个 写 操作 并 行 地 使 用 所 有 但 盘 ( 可 
能 较 慢 ) 

“每 个 淡 操作 并 行 地 使 用 所 有 碘 项 (可 
以 非常 快 ) 

“ 间 “时 间 只 有 “ 企 程 序 可 以 访问 阵列 





d) RAID-3 





* 在 一 个 条 里 可 以 存放 多 条 记录 
“一 个 磁盘 被 专门 用 来 存储 错误 校 验 
码 ( 比 RAID-2 有 更 多 的 数据 存储 
空间 ). 但 是 当 存在 频繁 的 写 操作 
时 、 这 个 磁 稚 会 很 繁 性: 

*ECC 用 来 恢复 条 内 损坏 的 数据 或 磁 
盘 

*“ 写 操 作 可 以 并 行 地 进行 

* 污 操作 可 以 并 行 地 进行 
“多 个 程序 的 访问 可 以 在 阵列 中 并 行 
地 进行 


e) RAID-4 


具有 相关 ECC 的 并 行 写 
写 到 不 同 磁盘 


“可 能 在 一 个 条 里 有 多 条 记录 

“所 有 的 磁盘 都 用 来 存放 数据 和 错误 
校 验 码 ， 所 以 没有 写 ECC 的 瓶颈 

“ECC 用 来 恢复 条 内 损坏 的 数据 或 磁 
盘 


磁盘 2 磁盘 3 磁盘 4 


。 与 操作 可 以 并 行 地 进行 
* 读 操作 可 以 并 行 地 进行 
“多 个 程序 的 访问 可 以 在 阵列 里 并 行 





f) RAID-5 
图 6-11 ( 续 ) 
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1.RAID-0 

RAID-0 (参见 图 6-11a) 是 能 提供 最 快 的 读 / 写 速度 和 最 有 效 的 数据 存储 的 磁盘 阵列 类 型 。 
企 RAID-0 (通常 称 为 磁盘 分 条 ) 中 ， 阵 列 内 所 有 的 磁盘 都 被 并 行 地 用 于 读 写 应 用 数据 。 如 果 
数据 库 应 用 需要 访问 非常 大 的 记录 (需要 访问 多 个 条 )， 或 是 一 组 相关 的 记录 ， 抑 或 是 读 写 操 
作 特别 频繁 ， 就 可 以 考虑 采用 RAID-0。 由 于 RAID-0 没 有 采用 任何 的 数据 元 余 和 差错 校 验 码 ， 
所 以 任何 一 个 磁盘 的 错误 都 会 导致 整个 数据 库 崩 溃 。 此 外 ，RAID-0 只 能 同时 执行 一 条 LO 命令 
(不 支持 多 线程 TO )。RAID-0 的 瓶颈 是 磁盘 控制 器 ， 它 可 能 会 被 大 量 并 发 的 MO 请 求 所 堵塞 ; 理 
想 情况 下 ， 应 该 在 磁盘 间 使 用 多 个 磁盘 控制 器 

2. RAID-! 

改善 容错 的 一 个 方法 是 将 数据 元 余 存 放 ，RAID-1 (参见 图 6-11b) 是 一 个 完全 的 元 余 存 储 ， 
也 称 为 磁盘 镜像 。 在 这 里 ， 每 一 页 都 被 元 余地 存储 。 虽 然 此 时 整个 磁盘 阵列 的 存储 空间 只 有 原 
来 的 一 半 ， 但 数据 库 系统 有 很 高 的 容错 能 力 ; 因为 某 一 页 在 两 个 副本 中 都 损坏 的 概率 是 非常 小 
的 。 一 个 由 两 个 磁盘 构成 的 RAID-1 阵 列 不 使 用 分 条 ， 但 是 可 以 增加 多 个 双 RAID-1 磁 盘 来 组 成 
一 个 带 有 分 条 的 大 阵列 (参考 下 面 的 RAID 0+1)。 在 RAID-1 中 ， 每 一 页 的 写 操作 都 必须 并 行 地 
写 到 两 个 磁盘 上 ， 所 以 不 会 有 任何 的 性 能 改善 。 但 即使 是 来 自 于 不 同 应 用 程序 (多 线程 ) 的 独 
立 数据 库 查 询 ， 两 个 读 操作 也 可 以 在 每 个 阵列 中 并 行 执行 。RAID-1 在 单 用 户 和 多 用 户 环 境 下 
都 具备 良好 的 性 能 和 容错 能 力 ， 磁 盘 价 格 的 不 断 下 跌 也 使 得 RAID- ! 无 可 争议 地 成 为 使 用 最 广 
证 的 RAID 技 术 形 式 。 

3.RAID 0+1 

正如 前 面 所 看 到 的 ，RAID-0 通 过 并 行 读 写 提供 极 高 的 性 能 ， 而 RAID-1 则 通过 完 余 存储 以 提 
供 容错 能 力 。 通 过 对 一 个 RAID-0 系 统 镜像 ， 就 可 以 得 到 RAID-0 和 RAID-1 的 所 有 优点 。 这 种 方 
法 称 为 RAID 0+ |， 或 RAID -10 (Compaq)、RAID-6 (HP) (图 6-11 中 没有 给 出 RAID 0+1 的 情况 )。 
RAID 0+ 1 提供 极 大 的 数据 存储 量 ， 高 可 靠 性 ， 并 可 以 防止 磁盘 失败 (Musciano ，1999)。 但 是 
这 种 方法 非常 昂贵 ， 它 只 能 用 于 需要 快速 响应 时 间 和 极 高 稳定 性 的 系统 中 ， 比 如 军事 的 实时 命 
令 和 控制 、 空 中 交通 管理 、 实 用 过 程控 制 和 一 些 电子 商务 的 应 用 (如 联机 的 投资 活动 )。 

4. RAID-2 

在 RAID-2 (参见 图 6-11c) 中 ， 一 些 磁 盘 使 用 数据 分 条 以 提供 并 行 数据 处 理 (无 元 余 存 储 )， 
而 另 一 些 磁盘 则 专门 存放 错误 校 验 码 。 这 些 错误 校 验 码 可 以 用 来 检测 数据 条 中 的 错误 ， 并 可 以 
在 条 中 的 页 损坏 时 重建 数据 。 和 RAID-1 采 用 宛 余 存储 来 恢复 损坏 的 数据 的 方法 不 同 ，RAID-2 
(和 以 后 的 层次 ) 利用 更 为 有 效 的 错误 校 验 码 (或 奇偶 码 ) 来 恢复 数据 。 由 于 目前 的 大 多 数 磁盘 
系统 已 经 在 单个 的 物理 页 里 提供 页 级 的 错误 校 验 码 或 奇偶 校 验 信息 ， 所 以 RAID-2 不 如 RAID-3 
理想 。 

5. RAID-3 

和 RAID-2 一 样 ，RAID-3 在 磁盘 间 将 数据 按 条 存放 ， 但 只 使 用 一 个 磁盘 来 存储 条 级 的 错误 
校 验 码 (参见 图 6-11d)。 侯 人 在 每 页 里 的 错误 校 验 码 用 来 检测 页 级 的 错误 ， 而 ECC 页 用 来 恢复 
损坏 的 页 。 假 设 图 6-11d 中 的 磁盘 3 贿 溃 ， 则 在 每 条 中 的 页 3 都 可 以 从 该 条 中 其 他 数据 页 和 错误 
校 验 页 中 使 用 一 个 异 或 计算 得 到 恢复 。 为 实现 这 一 功能 ， 所 有 对 于 某 一 条 内 页 数据 的 更 新 都 必 
须 将 该 条 内 的 所 有 数据 读 出 以 重新 计算 ECC 页 。 当 存在 很 长 的 记录 ， 以 致 一 个 记录 需要 一 个 或 
多 个 条 时 ,通常 使 用 RAID-3。 此 时 每 一 个 逻辑 的 读 / 写 都 可 以 分 布 到 阵列 的 磁盘 上 去 。 也 正 因 
为 每 一 个 逻辑 的 读 / 写 操作 需要 利用 所 有 的 磁盘 ， 所 以 就 不 能 同时 处 理 来 自 于 多 个 用 户 或 程序 
的 要 求 。RAID-3 比 较 适 宜 于 在 需要 大 量 读 取 、 少 量 修改 的 单 用 户 环境 中 使 用 。 组 成 RAID-3 条 
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的 磁盘 越 多 ， 磁 盘 的 总 体 利用 率 就 越 高 ; 系统 的 瓶颈 是 存放 ECC 的 磁盘 。 

6. RAID-4 

和 RAID-3 一 样 ，RAID-4 也 使 用 一 个 单独 的 磁盘 来 存放 错误 校 验 码 ， 但 是 一 个 条 可 以 存放 
多 条 记录 (参见 图 6-11e )。 因 此 对 于 不 同 记 录 的 读 操作 就 可 以 并 行进 行 ， 无 论 它们 是 来 自 于 同 
一 个 程序 ， 还 是 不 同 程序 。 系 统 的 瓶颈 是 用 于 存放 校 验 信息 的 磁盘 ， 因 为 每 当 数 据 有 修改 时 ， 
都 必须 访问 它 以 便 重 写 错误 校 验 页 。 对 联机 事务 处 理 等 带 有 频繁 更 新 的 数据 库 应 用 来 说 ， 这 样 
会 造成 对 奇偶 校 验 磁 盘 的 争 用 ， 由 此 影响 并 行 处 理 的 效能 。RAID-5 可 以 避免 这 种 瓶颈 情况 。 
注意 ， 有 些 作者 并 不 区 分 RAID-3 和 RAID-4。 

7. RAID-5 

RAID-5 也 被 称 为 循环 夺 偶 性 阵列 (如 图 6-11f 所 示 )， 它 不 使 用 … 个 单独 的 磁盘 来 存放 奇偶 
校 验 信息 ， 而 是 在 每 个 磁盘 上 同时 存放 数据 和 奇偶 校 验 页 。 读 操作 可 以 在 所 有 的 磁盘 上 并 行进 
行 ， 写 操作 则 需要 同时 访问 一 个 或 多 个 磁盘 ， 以 便 写 人 新 记录 并 写 人 该 记录 的 校 验 磁盘 。 出 于 
恢复 的 考虑 ， 不 同 的 记录 将 它们 的 错误 校 验 码 存放 在 不 同 的 磁盘 上 。 这 样 写 操作 也 可 以 并 行 地 
进行 ， 像 RAID-4 一 样 发 生 阻 塞 的 可 能 性 很 小 。 这 是 由 于 随机 的 记录 修改 会 使 随机 分 布 在 磁盘 
间 的 差错 校 验 码 页 更 新 。 

8.RAID 的 性 能 

在 前 面 的 讨论 中 ，RAID-1、RAID-3 和 RAID-5 是 最 主要 的 提供 容错 的 RAID 系 统 。 由 于 
RAID-3 是 为 单 用 户 和 数据 密集 的 环境 设计 的 ， 因 此 它 通常 有 其 特定 的 应 用 范围 。 对 于 大 多 数 
数据 库 应 用 来 说 ， 通 常 在 RAID-1、RAID 0+1 和 RAID-5 中 进行 选择 。 

RAID 的 生产 商 之 一 Adaptec (http://www.dpt.com ) 使 用 不 同 数目 和 不 同 传输 率 的 磁盘 组 成 
多 种 阵列 的 样式 ， 比 较 RAID-1 和 RAID-5 的 性 能 。 正 如 所 预期 的 一 样 ，RAID-5 在 使 用 存储 空间 
方面 比较 高 效 ， 因 为 它 不 是 为 每 个 数据 都 提供 副本 。 在 读 方面 ，RAID-5 也 比 RAID-1 的 性 能 突 
出 , 这 是 因为 当 阵列 内 有 相同 数目 的 磁盘 时 ，RAID-5 有 更 多 的 并 行 操作 。 但 是 对 于 写 操作 而 言 ， 
RAID-5 所 花费 的 时 间 可 能 是 RAID-1 所 需 时 间 的 1.67 到 3 倍 (取决 于 基准 程序 和 阵列 的 配置 ) 。 
因此 对 于 易于 发 生变 化 的 数据 而 言 ，RAID-5 不 如 RAID-1。Adaptec 同 时 估计 ， 为 使 写 操作 的 性 
能 达到 只 使 用 一 个 磁盘 的 两 倍 ，RAID-1 需 要 一 个 4 个 磁盘 的 阵列 ， 而 RAID-5 需 要 7 ~ 12 个 磁盘 。 

哪 种 RAID 是 最 好 的 选择 昵 ?对 于 容错 和 数据 库 维护 程序 (需要 高 的 稳定 运行 时 间 )， 或 当 
只 有 两 个 磁盘 控制 器 时 ，RAID-1 是 最 好 的 选择 。RAID-1 虽 然 代价 较 高 ， 但 是 对 各 种 工作 负载 
都 有 较 好 的 支持 。RAID-5 适 用 于 对 大 数据 集 的 密集 读 操作 ， 并 且 需 要 至 少 3 个 (通常 是 5 个 ) 
磁盘 。 随 着 磁盘 不 断 变 大 ，RAID-5 就 变 的 不 那么 合适 。 

存储 设备 是 一 个 快速 发 展 的 领域 。 像 存储 区 域 网 络 (SAN) 和 网 络 附加 存储 (NAS) 这 样 
的 新 技术 正在 大 企业 存储 环境 中 不 断 涌现 (Shah，1999)。 


6.9 数据 库 设 计 


大 多 数 的 现代 信息 系统 包括 数据 库 管理 系统 或 数据 仓库 系统 利用 数据 库 技术 来 支持 数据 存 
储 和 读 取 。 根 据 前 面 的 定义 ， 数 据 库 是 一 组 逻辑 上 相关 数据 的 集合 ， 用 于 满足 一 个 组 织 内 的 多 
个 用 户 的 信息 需求 。 数 据 库 内 文件 之 间 的 联系 是 通过 概念 模型 和 逻辑 模型 的 联系 来 定义 的 ， 这 
些 联系 隐 含 对 数据 访问 的 路 径 。 不 同 种 类 的 数据 库 系统 支持 不 同类 型 的 访问 路 径 ， 所 以 对 于 
DBMS 和 数据 仓库 技术 的 选择 是 一 种 将 所 需 访问 路 径 与 数据 系 技术 功能 相 匹配 的 功能 。 
数据 库 体系 结构 选择 

不 同 的 数据 库 管理 系统 和 数据 仓库 系统 使 用 不 同 的 数据 定义 和 构造 形式 ， 统 称 为 数据 库 的 
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体系 结构 。 确 定 何 种 数据 库 体系 结构 最 适合 数据 库 是 数据 库 设计 的 基础 。 数 据 库 或 数据 仓库 系 
统一 般 支 持 5 种 不 同体 系 结构 ， 图 6-12 比 较 了 这 5 种 体系 结构 。 


CT 
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多 维 数据 库 模 型 一 一 多 维 立 方 体 视图 


多 维 数据 库 模型 一 一 星 型 模式 视图 
图 6-12 数据 库 体系 结构 
1. 层次 数据 库 模 型 


在 这 个 模型 中 ， 文 件 用 类 似 于 树 或 族谱 图 的 形式 以 自 顶 向 下 的 结构 来 组 织 。 数 据 之 间 存 在 
着 嵌 套 和 一 对 多 的 联系 。 顶 端的 文件 称 为 根 (root) ， 底 端的 文件 称 为 叶 (leaf)， 中 层 的 文件 
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有 惟一 的 父 文件 (又 称 属 主 ) 和 若干 个 子 文件 。 作 为 一 种 最 老 的 数据 库 体 系 结构 ， 很 多 层次 化 
的 数据 库 系 统 仍然 在 大 型 的 企业 中 使 用 。 如 果 概 念 数 据 模型 是 一 棵 树 ， 或 者 大 多 数 的 数据 访问 
从 根 文件 开始 ， 那 么 层次 数据 库 模 型 就 相当 适用 。 层 次 数据 库 技术 主要 应 用 十 数据 量 很 大 的 事 
务 处 理 和 MIS 系 统 。 新 数据 库 系统 很 少 再 使 用 层次 化 的 DBMS ， 这 是 由 于 新 型 应 用 所 需要 的 往 
往 不 止 是 简单 的 事务 处 理 或 事务 数据 的 统计 。 

2. 网 状 数据 库 模型 

在 这 个 模型 里 ， 一 个 文件 可 以 与 任意 数目 的 文件 相关 联 。 这 个 模型 很 灵活 (层次 模型 只 是 
网 状 模型 的 特例 )， 它 可 以 实现 任何 联系 。 但 是 由 于 这 种 实现 形式 往往 在 不 同文 件 内 的 相关 记 
孙 间 大 量 使 用 指针 ， 因 而 会 导致 存储 空间 的 浪费 和 维护 上 的 困难 。 通 常情 况 下 ， 网 状 模型 只 支 
皖 沿 着 弧 的 一 对 多 联系 ， 但 是 某 些 网 状 系 统 也 支持 多 对 多 联系 。 在 主机 系统 中 ， 网 状 模 型 仍然 
被 广泛 使 用 于 大 数据 量 的 事务 处 理应 用 。 由 于 数据 库 设 计 人 员 对 于 数据 组 织 有 很 大 的 控制 权 ， 
所 以 可 以 设计 出 高 度 优化 的 数据 库 。 例 如 ， 每 个 记录 类 型 (用 网 络 中 的 盒 来 表示 ) 可 以 使 用 散 
列 算法 来 组 织 ， 或 和 相关 的 记录 邻接 存放 (这 是 早期 的 聚焦 形式 )。 和 层次 模型 相 比 ， 网 状 模 
型 的 系统 可 以 满足 更 广泛 的 操作 需求 。 但 是 网 状 系统 需要 复杂 的 编程 和 数据 库 设 计 技 术 ， 因 此 


3. 关系 数据 库 模 型 

这 是 最 流行 的 数据 库 模 型 ， 它 为 每 个 关系 定义 简单 的 表 以 及 多 对 多 联系 。 表 间 的 交 又 引用 
键 用 来 关联 相关 的 表 ， 表 示 实 体 间 的 联系 。 主 键 和 辅 键 索 引 根据 条 件 对 数据 进行 快速 访问 。 大 
多 数 应 用 是 利用 关系 数据 库 管理 系统 构建 的 ， 还 存在 许多 关系 DBMS 产 品 。 第 5 章 中 我 们 详细 
讨论 了 关系 数据 模型 的 特性 ， 第 9 章 中 会 介绍 一 种 关系 查询 语言 一 一 按 例 查 询 (query-by- 
example)， 第 7 ~ 8 章 中 会 介绍 使 用 最 为 广泛 的 SQL 关 系数 据 操纵 语言 。 

4. 面向 对 象 数据 库 模型 

属性 和 操作 属性 的 方法 封装 在 称 为 对 象 类 的 结构 中 。 可 以 通过 将 一 个 对 象 类 了 余 套 或 封装 在 
男 一 个 类 里 来 表示 类 间 的 关联 ， 新 的 对 象 类 可 以 从 更 一 般 化 的 对 象 类 中 导出 。 这 种 数据 模型 的 
一 个 主要 优点 是 支持 如 图 像 、 视 频 和 声音 等 复杂 数据 类 型 ， 就 像 支 持 简单 数据 类 型 一 样 容 易 。 
这 是 一 种 最 新 的 DBMS 技 术 ， 大 型 企业 有 选择 地 使 用 它 来 支持 复杂 的 数据 类 型 和 事件 驱动 的 程 
序 。 第 14 章 和 第 15 章 将 介绍 如 何 使 用 这 种 模型 进行 概念 数据 建 模 和 数据 库 实现 。 

5. 多 维 数据 库 模 型 

这 是 一 种 在 数据 仓库 中 使 用 的 数据 库 模 型 ， 有 两 种 理解 它 的 方法 。 第 一 种 方法 是 将 数据 看 
做 是 多 维 的 立方 体 ， 其 中 的 每 一 个 单元 包含 一 个 或 多 个 简单 的 属性 ， 维 则 是 用 来 对 原始 数据 分 
类 的 。 这 些 种 类 (或 维 ) 被 用 户 用 来 对 数据 进行 统计 和 分 片 ， 这 样 的 数据 通常 包括 时 间 段 、 地 
理 位 置 、 业 务 种 类 和 人 名 等 。 每 个 单元 所 包含 的 是 与 它 的 所 有 维 值 都 相关 的 数据 。 比 如 ， 一 个 
单元 可 能 包含 涉及 特定 时 间 段 、 地 点 和 销售 人 员 的 物品 销售 的 属性 。 另 外 -- 种 理解 方式 是 通过 
星 型 模式 (star schema)。 中 心 是 事实 表 ， 相 当 于 多 维 视图 的 一 个 单元 。 这 个 表 包 含有 所 有 的 
原始 属性 和 一 个 由 周围 环绕 的 维 表 主 键 构成 的 复合 键 。 每 一 个 周围 的 维 表 定义 一 种 对 数据 进行 
分 类 的 方法 ， 比 如 对 每 个 销售 人 员 的 全 部 描述 信息 。 多 维 数据 库 模 型 设计 的 关键 问题 是 事先 定 
义 数 据 的 最 小 公分 母 和 用 户 用 来 对 原始 数据 进行 统计 的 维 或 分 类 。 尽 管 多 维 数据 库 模型 只 是 关 
系数 据 模型 和 网 状 数据 的 特例 ， 但 是 已 经 开发 出 一 些 专门 为 维 数据 处 理 进行 优化 的 DBMS。 第 
11 章 会 讨论 多 维 数据 模型 和 数据 仓库 。 

在 本 书 中 ,我们 只 详细 讨论 三 种 最 新 的 数据 库 模型 ， 关 系数 据 库 模 型 、 面 向 对 象 数 据 库 横 
型 和 多 维 数据 库 模型 。 如 果 读 者 想 了 解 有 关 层 次 和 网 状 数据 库 模型 的 更 多 知识 ， 可 以 自行 参阅 
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本 章 后 面 进一步 阅读 中 的 相关 资料 。 
6.10 优化 查询 性 能 


现在 进行 物理 数据 库 设 计 的 主要 目标 是 优化 数据 库 处 理 的 性 能 。 数 据 库 处 理 包括 对 数据 的 
添加 、 删 除 和 修改 ， 还 包括 大 量 的 数据 检索 活动 。 对 于 那些 读 取 操作 远 多 于 维护 操作 的 数据 库 
系统 来 说 ， 优 化 查询 性 能 (最 终 用 户 的 联机 查询 或 是 脱 机 的 报表 生成 等 ) 就 显得 非常 重要 。 在 
本 章 前 面 我 们 已 经 介绍 了 大 部 分 可 以 用 来 优化 数据 库 设计 以 满足 查询 要 求 的 设计 因素 (如 聚 禾 、 
索引 和 文件 组 织 等 )。 在 本 章 的 最 后 一 节 ， 我 们 会 讨论 一 些 现 在 很 多 DBMS 所 提供 的 用 于 数据 
库 设 计 和 处 理 的 其 他 高 级 选项 。 

数据 库 设 计 人 员 优 化 查询 的 工作 量 是 和 所 使 用 的 数据 库 管 理 系统 密切 相关 的 。 由 于 聘请 专 
业 级 的 数据 库 开发 人 员 的 成 本 很 高 ， 所 以 数据 库 和 查询 的 设计 工作 越 少 ， 开 发 和 维护 数据 库 系 
统 的 开销 就 会 越 少 。 一 些 DBMS 在 处 理 查 询 和 合理 安排 数据 的 物理 存储 以 优化 数据 读 写 时 ， 不 
需要 数据 库 设 计 人 员 和 查询 编写 人 员 进 行 太 多 的 控制 。 而 另外 一 些 系 统 则 需要 应 用 的 开发 人 员 
进行 很 多 控制 ， 需要 大 量 的 工作 来 调整 数据 库 设 计 和 查询 的 结构 才 可 以 获得 可 接受 的 性 能 。 有 
时 候 ， 数 据 库 系统 的 工作 量变 化 很 大 ， 设 计 的 选项 又 如 此 的 微妙 ， 因 而 很 难 获得 良好 的 性 能 。 
如 果 数 据 库 系统 的 工作 是 相对 固定 的 ， 比 如 对 于 数据 仓库 来 说 ， 批 量 的 数据 更 新 很 少 而 主要 是 
数据 量 很 大 的 查询 操作 ， 此 时 就 可 以 通过 使 用 DBMS 中 的 查询 优化 器 和 良好 的 数据 库 、 查 询 设 
计 来 取得 很 好 的 性 能 。 比 如 ， 可 以 调整 NCR Teradata DBMS 以 完成 数据 仓库 环境 下 的 并 行 处 理 。 
在 这 种 情况 下 ， 数 据 库 和 查询 的 设计 人 员 就 很 难 再 对 改善 数据 库存 储 和 处 理 数据 的 性 能 做 出 特 
别 的 贡献 。 但 是 这 种 情况 很 少 ， 所 以 数据 库 设 计 人 员 仍然 应 该 仔细 研究 那些 可 以 改善 数据 库 处 
理性 能 的 选项 。 

6.10.1 并 行 查询 处 理 

过 去 几 年 中 ， 计 算 机 体系 结构 中 一 个 很 大 的 变化 是 越 来 越 多 地 在 数据 库 服务 器 中 使 用 多 处 
理 器 。 数 据 库 服务 器 通常 使 用 对 称 多 处 理 器 (SMP) 技术 (Schumacher，1997)。 为 利用 这 种 
并 行 处 理 的 功能 ， 一 些 先进 的 DBMS 可 以 将 查询 分 解 为 多 个 在 相关 处 理 器 上 并 行 处 理 的 模块 。 
最 常见 的 方法 总 将 查询 复制 ， 然 后 让 每 个 查询 副本 在 一 部 分 数据 库 上 (通常 是 水 平分 割 (一 组 
行 )) 运行 。 分 割 需要 预先 由 数据 库 设计 人 员 定 义 。 相 同 的 查询 在 单独 的 处 理 器 上 分 别针 对 数 
据 库 的 一 部 分 运行 ， 每 个 处 理 器 产生 的 中 间 结 果 合 并 结合 起 来 组 成 最 终 的 结果 ， 就 好 像 查 询 是 
在 整个 数据 库 上 运行 的 一 样 。 

假设 一 个 Order 表 中 有 几 百 万 行 记 录 ， 这 导致 查询 的 性 能 下 降 。 为 确保 今后 对 于 该 表 的 扫 
描 能 够 至 少 使 用 3 个 处 理 器 并 行 运行 ， 可 以 使 用 下 面 的 SQL 语句 来 改变 表 的 结构 ; 

ALTER TABLE ORDER PARALLEL 3 

设计 人 员 要 调整 每 个 表 使 之 达到 最 佳 的 并 行 性 ， 通 常 这 种 方法 并 不 常见 ， 因 为 这 需要 多 次 
对 表 进行 修改 才能 够 达到 合理 的 并 行 度 。 

并 行 查询 的 处 理 速度 可 能 是 非常 惊人 的 。 在 Schumacher (1997) 报告 的 一 次 测试 中 ， 相 对 
于 普通 的 表 扫 描 ， 使 用 并 行 处 理 可 以 将 查询 时 间 缩 短 一 半 。 由 于 索引 本 身 也 是 一 个 表 ， 因 此 也 
可 以 采用 并 行 结构 来 设计 索引 以 加 快 扫 描 的 速度 。Schumacher (1997) 还 报告 了 一 个 例子 ， 通 
过 使 用 并 行 处 理 ， 创 建 一 个 索引 的 时 闻 代 价 从 大 约 7 分 钟 缩短 到 5 秒 ! 

除 表 扫 描 以 外 ， 其 他 的 查询 操作 也 可 以 并 行 地 进行 ， 如 某 些 类 型 的 相关 表 的 联结 操作 ， 检 
询 结果 的 分 类 ， 几 个 查询 结果 的 组 合 ( 称 为 联合 )， 行 的 排序 和 计算 聚集 值 等 。 行 的 修改 、 删 
除 和 插入 操作 同样 可 以 并 行 地 处 理 。 此 外 ， 一 些 数据 库 创建 命令 的 性 能 也 可 以 通过 并 行 处 理 得 
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到 改善 ， 包括 索 引 的 创建 和 重建 ， 利 用 数据 库 中 的 数据 创建 表 等 。 必 须 使 用 规格 说 明 预 先 配置 
Oracle 环 境 以 指定 虚拟 的 并 行 数据 库 服务 器 的 数目 ， 此 后 ， 查 询 处 理 器 就 会 为 每 个 命令 选择 它 
认为 最 好 的 并 行 处 理 方法 。 

6.10.2 对 自动 查询 优化 的 重 载 

有 时候， 查询 编写 者 知道 (或 可 以 了 解 ) 查询 的 一 些 关键 信息 ， 而 DBMS 中 查询 优化 的 模 
块 却 可 能 忽略 或 是 不 知道 这 些 信 息 。 当 掌握 这 些 关 键 信息 时 ， 查 询 编写 者 才能 知道 查询 执行 的 
最 优 路 径 。 但 是 ， 在 编写 者 确定 自己 的 路 径 为 最 优 路 径 前 ， 他 首先 应 该 知道 查询 优化 器 (通常 
会 选择 预期 查询 时 间或 代价 最 小 的 查询 处 理 方法 ) 会 如 何 处 理 这 条 查询 ， 尤 其 是 对 于 那些 以 前 
役 有 执行 过 的 语句 更 是 如 此 。 幸 运 的 是 ， 大 多 数 的 关系 DBMS 可 以 在 实际 执行 语 名 以前， 告知 
用 户 优化 器 的 执行 计划 。 像 EXPLAIN 或 是 EXPLAIN PLAN ( 与 数据 库 系统 相关 ) 这 样 的 命令 
会 显示 出 查询 优化 器 准备 如 何 访问 索引 、 使 用 并 行 处 理 器 和 对 表 作 联 结 来 产生 结果 。 如 果 用 户 
人 在 实际 的 数据 库 命令 前 加 上 EXPLAIN 子 句 ， 查 询 处 理 器 就 会 显示 处 理 查询 的 逻辑 步骤 ， 并 在 
实际 访问 数据 库 以 前 停止 。 查 询 优化 器 基于 每 张 表 的 统计 数据 来 确定 最 优 的 执行 路 径 ， 比 如 每 
行 的 平均 长 度 或 是 表 中 的 行 数 等 。 在 必要 时 可 以 让 DBMS 计 算 当 前 数据 库 最 新 的 统计 数据 ( 比 
如 Oracle 中 的 Analyze 命 令 ) 以 得 到 准 切 的 估计 查询 代价 。 用 户 可 以 使 用 多 种 方式 书写 一 个 查询 
语句 ， 并 通过 EXPLAIN 命 令 获得 系统 对 于 它们 性 能 的 预期 。 然 后 用 户 就 可 以 选择 预期 处 理 时 
间 基 少 的 查询 来 执行 ， 或 是 当 觉得 代价 过 高 时 撤销 该 查询 。 

还 有 其 他 的 改善 查询 处 理性 能 的 方法 。 在 某 些 DBMS 中 ， 用 户 可 以 让 DBMS 使 用 不 同 的 处 
理 步骤 ， 或 是 使 用 DBMS 的 功能 ， 比 如 并 行 服务 器 等 ， 而 不 是 使 用 查询 优化 器 所 认为 的 最 佳 的 
计划 。 

例如 ， 用 户 希 望 统计 某 一 个 销售 代表 Smith 所 处 理 的 订单 数目 。 在 Oracle 数 据 库 中 ， 只 有 当 
一 个 表 被 扫描 时 才 使 用 并 行 处 理 ， 而 如 果 通 过 索引 访问 表 就 不 使 用 。 此 时 用 户 可 以 指定 系统 总 
是 对 整个 表 的 扫描 使 用 并 行 处 理 ， 完 成 这 个 查询 的 命令 如 下 

SELECT /*+FULL (ORDER) PARALLEL (ORDER 3) */ COUNT (*) 

FROM ORDER 

WHERE SALESPERSON= "SMITH"; 


在 /* */ 内 的 子 句 是 传递 给 Oracle 的 提示 ， 它 会 覆盖 Oracte 为 查询 自然 生成 的 查询 计划 。 因 
此 ， 提 示 是 与 查询 语句 相关 的 ， 但 在 此 之 前 ， 用 户 应 该 修改 表 的 结构 以 适应 并 行 处 理 的 需要 。 
6.10.3 选择 数据 块 大 小 

在 本 章 的 前 面 已 经 提 到 ， 数 据 在 RAM 和 磁盘 之 间 以 块 或 页 为 单位 进行 传输 。 数据 块 的 大 
小 会 对 查询 的 性 能 产生 很 大 的 影响 。 如 果 数 据 块 太 小 ， 对 于 表 中 行 的 一 次 或 多 次 访问 会 导致 很 
多 次 的 物理 1/O 操 作 ; 如 果 数 据 块 太 大 ， 就 会 浪费 时 间 去 传输 本 不 需要 的 数据 。 通常， 块 的 最 
小 值 为 2K 字 节 ， 最 大 值 则 由 计算 机 的 操作 系统 决定 ， 往 往 是 32K 或 更 多 。 一 旦 为 数据 库 确 定 了 
数据 库 块 的 大 小 ， 就 很 难 改动 ; 除非 先 卸 载 数据 ， 再 更 改 数据 库 ， 最 后 重新 装载 数据 。 

要 选择 合适 的 块 大 小 ， 就 必须 在 5 个 性 能 因素 间 进行 权衡 ， 这 5 个 因素 (Yuhanna，2000) 
列举 如 下 : 

“ 块 争 用 ”这 是 对 几 个 1O 操 作 需 要 同时 访问 一 个 数据 块 的 可 能 性 的 度量 ， 较 小 的 块 会 减少 

争 用 的 次 数 。 如 果 在 同一 个 数据 库 上 运行 多 个 并 发 作业 ， 例 如 有 许多 联机 用 户 ， 那 么 这 

种 环境 下 争 用 的 情况 就 会 比较 突出 。 

* 随机 行 访问 速度 ”这 个 指标 衡量 访问 表 中 任意 一 行 的 速度 ， 此 时 ， 小 的 数据 块 会 有 比较 

好 的 表现 。 在 联机 事务 处 理 中 ， 随 机 的 行 访问 比较 普遍 。 
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* 顺序 行 访问 速度 ”这 个 指标 衡量 对 表 进 行 扫描 的 速度 ， 此 时 大 的 数据 块 会 比较 好 。 如 果 
使 用 较 大 的 块 ， 一 个 IO 操作 就 可 以 读 取 许 多 行 高 速 缓存 在 内 存 中 ， 从 而 减少 查询 所 需 的 
需要 读 取 表 中 所 有 行 的 物理 IO 操作 的 数 日 。 在 使 用 罕 答 (本章 前 面 介绍 过 ) 的 情况 下 ， 

大 的 块 只 需要 一 个 MO 操作 就 可 以 将 某 个 肾 禾 高 速 缓存 起 来 。 在 决策 支持 系统 、 数 据 仓库 

应 用 和 产生 事务 概要 报告 的 应 用 中 ， 会 有 比较 多 的 顺序 扫描 。 

*， 行 大 小 ”这 是 指 表 中 一 行 所 有 字段 的 长 度 之 和 ， 通 常情 况 下 块 的 大 小 最 好 等 于 物理 表 中 

的 行人 小 ， 或 是 它 的 整数 倍 。 

。 开 销 ”这 是 DBMS 为 管理 产生 查询 结果 和 进行 其 他 数据 库 工作 所 需 的 VO 操作 所 产生 的 时 

间 代 价 。 小 的 块 会 比 大 的 块 带 来 更 多 的 开销 。 

很 难 有 一 个 块 大 小 可 以 满足 上 面 的 所 有 要 求 。 一般 米 说 ,小 的 块 适用 于 联机 事务 处 理应 用 ， 
而 大 的 块 适用 于 决策 支持 数据 库 和 数据 仓库 系统 。 如 果 一 个 系统 的 工作 负载 不 那么 确定 ， 对 数 
据 块 的 调节 就 会 很 困难 。 

6.10.4 在 磁盘 控制 器 间 平 衡 WVO 操 作 

“个 磁盘 控制 器 会 管理 附属 于 它 的 磁盘 所 具有 的 IO 操作 。 磁 盘 控 制 器 越 多 越 好 (并 行 度 
越 高 ， 性 能 越 好 )， 但 是 它 的 数 日 会 受到 经 费 的 限制 。 多 磁盘 控制 器 的 优点 在 它们 都 工作 时 才 
会 显示 出 来 ， 所 以 设计 和 人员 需 要 合理 地 分 布 数据 库 和 DBMS 系 统 文件 ， 以 使 工作 负载 平均 分 配 
到 每 个 控制 器 上， 最 好 是 在 每 个 磁盘 上 。 

即使 加 载 了 数据 ， 表 仍然 可 以 容易 地 从 一 个 磁盘 移动 到 另 一 个 磁盘 ， 所 以 初始 的 文件 存放 
配置 是 可 以 改变 的 。 为 改善 查询 处 理 的 性 能 ， 设 计 人 员 必 须 做 好 以 下 工作 : 

。 了 解 文件 在 磁盘 上 的 分 布 情况 以 及 控制 器 和 磁盘 的 相互 关系 。 

* 知道 在 数据 库 上 运行 的 预定 义 程序 和 特别 查询 的 本 质 (应 该 关注 最 重要 的 程序 或 是 性 能 

特别 差 的 日 子 或 时 间 )。 

。 收 集 有 关 磁 盘 、 控 制 器 的 使 用 信息 和 表 (分 割 ) 的 访问 情况 统计 信息 。 

“通过 在 磁盘 和 控制 器 问 移动 表 来 重新 平衡 工作 负载 。 

一 般 来 说 ， 如 果 不 能 将 一 个 查询 (或 是 同时 运行 的 多 个 查询 ) 所 需 的 数据 存储 在 相同 的 数 
据 块 上 ， 那 么 就 最 好 将 它们 分 布 在 不 同 控制 器 的 不 同 磁盘 上 以 便 对 数据 进行 并 行 的 访问 。 和 前 
面 一 样 ， 虽 然 有 可 能 ， 但 是 在 一 个 工作 负载 不 断 变 化 的 系统 中 进行 优化 也 是 极为 困难 的 。 设 计 
人 员 需 要 集中 关注 几 个 最 重要 的 应 用 (或 每 天 性 能 都 特别 不 理想 的 程序 ) ， 分 析 这 些 应 用 ， 重 
新 分 配 文件 的 存储 为 它们 提供 尽 可 能 最 好 的 性 能 ， 同 时 尽量 不 对 其 他 程序 造成 太 大 的 影响 。 
6.10.5 设计 良好 查询 的 建议 

本 章 的 前 面 讨论 了 许多 技术 和 方法 ， 这 些 技术 和 方法 用 来 改进 数据 库 和 查询 的 设计 以 加 快 
查询 处 理 的 速度 。 很 多 数据 库 专 家 都 对 于 提高 查询 效率 给 出 了 建议 ， 它 们 中 的 一 些 在 前 面 没 有 
提 及 。 读 者 可 以 参阅 DeLoach (1987)、Holmes (1996) 和 Kurka ( 1999) 的 著作 来 了 解 更 多 有 
关 在 不 同 设置 下 改善 查询 效率 的 建议 。 下 面 概要 地 介绍 其 中 一 些 普遍 适用 于 各 种 环境 的 建议 : 

“了 解 在 查询 处 理 中 索引 的 应 用 原理 很 多 DBMS 在 一 次 查询 中 对 每 张 表 只 使 用 一 个 索引 。 

设计 人 员 需 要 了 解 DBMS 如 何 选择 索引 ， 并 监控 索引 的 使 用 情况 ， 然 后 就 可 以 删除 那些 

很 少 使 用 的 索引 ， 由 此 改善 数据 库 更 新 操作 的 性 能 。 一 般 来 说 ， 有 相等 条 件 (如 WHERE 

Finish= “Birch”OR “Walnut”) 的 查询 比 其 他 具有 更 复杂 的 限定 条 件 的 查询 (如 

WHERE Finish NOT= “Walnut”) 处 理 的 速度 要 快 ， 这 是 因为 相等 条 件 可 以 使 用 索引 的 

值 来 进行 判定 。 设 计 人 员 需 要 学 习 DBMS 处 理 查询 中 不 同类 型 子 句 的 方法 。 

“在 查询 中 为 字段 和 文字 使 用 相 容 的 数据 类 型 使 用 相 容 的 数据 类 型 可 以 让 DBMS 不 需要 在 
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查询 处 理 时 进行 类 型 转化 。 

* 编写 简单 的 查询 通常 来 说 ，DBMS 比 较 容易 处 理 简单 形式 的 查询 。 比 如 由 于 关系 数据 库 
管理 系统 基于 集合 的 理论 ， 所 以 可 以 编写 处 理 行 集 和 文字 集 的 查询 。 

“将 复杂 的 查询 分 解 为 多 个 简单 的 部 分 由 于 DBMS 可 能 只 为 每 个 查询 使 用 一 个 索引 ， 所 以 
最 好 将 复杂 的 查询 分 解 为 多 个 比较 简单 的 部 分 ( 这样 就 会 为 每 一 个 部 分 都 使 用 索引 )， 然 
后 将 这 些 简单 查询 的 结果 结合 起 来 。 例 如 ， 由 于 关系 DBMS 使 用 集合 ， 所 以 DBMS 将 两 
个 独立 的 简单 查询 的 结果 集 进 行 UNION 操 作 是 很 容易 的 。 

* 不 要 将 查询 谋 套 正如 读者 在 第 7、8 章 中 将 学 习 到 的 ，SQL 语 言 支持 查询 语句 的 修 套 形 
式 《( 内 部 的 查询 称 为 子 查 询 )。 在 产生 同等 结果 的 情况 下 ， 通 常 不 包含 子 查询 的 查询 会 有 
更 好 的 性 能 。 

“不 有 要 将 表 和 自己 结合 在 一 起 ”如 果 可 能 的 话 ， 避 免 在 一 个 查询 内 为 表 赋 了 予 两 个 (多 个 ) 
不 同 的 角色 〈 称 为 自 联结 ， 将 在 第 7 章 中 介绍 )。 通 常 为 表 作 一 个 临时 的 副本 ， 然 后 将 表 
和 副本 联结 ， 其 性 能 会 好 得 多 。 

“为 一 组 查 均 创建 临时 表 ”在 可 能 的 情况 下 ， 应 该 在 一 组 查询 中 重用 数据 。 例 如 ， 如 果 - 一 
系列 查询 都 引用 数据 库 内 的 同一 个 数据 集 ， 那 么 就 最 好 先 将 这 个 数据 集 存放 在 一 个 或 多 
个 临时 表 中 ， 然 后 在 查询 中 使 用 这 些 临 时 表 。 这 样 就 会 避免 为 每 个 查询 重复 进行 相同 的 
联结 和 重复 扫描 数据 库 的 表 。 缺 点 是 如 果 在 查询 运行 的 过 程 中 ， 原 始 表 的 数据 更 新 ， 那 
么 临时 表 的 数据 不 会 改变 。 

“结合 更 新 操作 ”如 果 可 能 ， 就 应 该 把 多 个 更 新 操作 结合 为 一 个 更 新 操作 。 这 样 会 减少 查 
询 处 理 的 开销 ， 并 允许 DBMS 寻 找 并 行 处 理 的 方法 。 

“只 检索 那些 需要 的 数据 这样 会 减少 数据 块 的 访问 和 传输 。 虽 然 这 看 起 来 很 明显 ， 但 是 
在 一 些 查询 的 编写 中 常常 破坏 这 一 准则 。 例 如 ，SQL 语 名 SELECT * FROM EMP 会 从 表 
EMP 中 读 取 所 有 行 的 所 有 字段 。 但 是 ， 如 果 用 户 只 是 想 查 看 表 中 的 某 些 列 ， 传 输 额 外 的 
列 就 会 增加 查询 处 理 所 需 要 的 时 间 。 

“必须 为 DBMS 的 排序 操作 提供 索引 如 果 数 据 要 以 排序 的 方式 显示 ， 而 在 需要 排序 的 关键 
字段 上 又 没有 索引 ， 就 应 该 先 读 取 无 序 的 数据 ， 然 后 在 DBMS 外 进行 排序 。 通 常 一 个 用 
于 排序 的 实用 程序 会 比 不 使 用 索引 的 DBMS 排 序 快 。 

“ 学习! ”跟踪 查询 的 处 理 时 间 ， 使 用 EXPLAIN 语 名 来 评审 查询 计划 ， 更 多 地 了 解 DBMS 
处 理 查询 的 方法 。 参 加 DBMS 厂 商 举办 的 特别 培训 来 提高 编写 高 效率 查询 的 能 力 ， 这 会 
使 你 更 加 了 解 查询 优化 器 的 情况 。 

“最 后 ， 考 虑 处 理 特殊 查询 所 需 的 全 部 时 间 ”这 里 所 说 的 全 部 时 间 包 括 程 序 员 (或 最 终 用 
户 ) 编写 查询 的 时 间 和 查询 实际 执行 所 需要 的 时 间 。 在 大 多 数 情况 下 ， 对 王 特殊 查询 ， 
最 好 让 DBMS 多 作 一 点 额外 的 工作 而 不 是 让 用 户 更 快 地 编写 查询 。 技术 的 目标 不 就 是 要 
让 人 们 工作 效率 更 高 吗 ? 因此 不 要 花费 大 量 的 时 间 去 试图 为 某 个 特殊 查询 写 出 最 高 效 的 
查询 语句 。 只 要 书写 一 个 逻辑 上 正确 的 查询 (能 产生 正确 的 查询 结果 ) 即 可 ， 其 他 的 工 
作 就 交 给 DBMS 去 作 (当然 应 该 预先 使 用 EXPLAIN 来 确保 查询 是 可 行 的 ， 以 避免 其 他 用 
户 的 查询 都 受到 严重 延迟 )。 这 就 导出 一 个 推论 : 如 果 可 能 ， 在 数据 库 系 统 负载 较 轻 的 时 
候 运 行 查询 ， 因 为 总 的 查询 处 理 时 间 是 受 其 他 DBMS 上 运行 的 工作 影响 的 。 

到 此 为 止 ， 我 们 结束 了 对 优化 数据 库 性 能 的 高 级 选项 的 讨论 。 不 是 所 有 的 选项 都 适用 于 每 

个 DBMS ， 由 于 底层 设计 的 不 同 ， 每 个 DBMS 通 常会 有 它 自 己 特 有 的 优化 选项 。 读 者 应 该 阅读 
你 所 使 用 DBMS 的 用 户 手册 ， 以 了 解 可 用 的 特殊 优化 选项 。 
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在 物理 数据 库 设计 的 过 程 中 ， 设 计 人 员 将 对 数据 的 逻辑 描述 转化 为 对 数据 存 取 的 技术 规格 
说 明 。 设 计 的 目标 是 创建 一 种 存储 方案 ， 以 提供 足够 的 性 能 ， 并 确保 数据 库 的 完整 性 、 安 全 性 
和 可 恢复 性 。 在 物理 数据 库 设计 中 ， 设 计 人 员 通 过 将 关系 规范 化 、 估 计数 据 量 、 定 义 数 据 、 考 
虑 数据 处 理 的 需求 和 频 度 、 用 户 预 期 和 数据 库 技 术 的 特征 ， 来 定义 字段 ， 设 计 记 录 、 文 件 组 织 
和 数据 库 体系 结构 。 

一 个 字段 是 应 用 程序 数据 的 最 小 单元 ， 相 当 于 逻辑 数据 模型 中 的 一 个 属性 。 设 计 人 员 要 根 
据 一 系列 因素 为 每 个 字段 定义 数据 类 型 、 完 整 性 控制 和 如 何 处 理 缺失 值 。 数 据 类 型 是 为 表示 组 
级 数 据 而 使 用 的 具体 的 编码 方案 ， 可 以 通过 为 数据 编码 和 压缩 数据 来 节省 存储 空间 。 字 段 的 完 
整 性 控制 包括 为 字段 定义 默认 值 、 人 允许 值 的 范围 、 是 否 可 以 使 用 空 值 和 参照 完整 性 。 

物理 记录 是 存储 在 邻接 内 存 区 域 的 一 组 记录 ， 它 是 数据 读 取 的 基本 单位 。 物 理 记录 通常 存 
储 在 页 (或 数据 块 ) 中 ， 页 是 二 级 存储 一 次 输入 或 输出 操作 时 读 取 或 写 人 的 数据 量 。 一 页 中 记 
孙 的 数目 称 为 块 因 子 。 出 于 效率 的 考虑 ， 一 个 关系 的 属性 不 一 定 存储 在 一 条 物理 记录 中 ， 而 来 
自 于 多 个 关系 的 属性 可 以 存储 在 一 条 物理 记录 里 。 非 规范 化 的 过 程 将 规范 化 的 关系 转化 为 非 规 
范 化 的 物理 记录 规格 说 明 。 非 规范 化 将 在 单个 1O 操 作 中 经 常 一 起 使 用 的 属性 存放 在 一 条 物理 
记录 里 。 水 平分 割 是 非 规范 化 的 一 种 ， 它 将 一 个 关系 分 解 为 多 个 记录 规格 说 明 ， 根 据 公 共 列 的 
值 将 行 存放 到 不 同 的 记录 中 去 。 非 规范 化 还 包括 垂直 分 割 ， 此 时 将 一 个 关系 的 列 分 布 到 不 同 的 
文件 里 ， 而 主键 需要 出 现在 每 个 文件 里 。 

一 个 物理 文件 是 二 级 存储 中 命名 的 部 分 ， 它 用 来 存储 物理 记录 。 物 理 文件 里 的 数据 是 通过 
顺序 存储 和 指针 的 结合 来 组 织 的 。 指 针 是 用 来 定位 相关 字段 或 数据 记录 的 一 个 数据 字段 。 

文件 组 织 负责 在 二 级 存储 设备 上 安排 文件 中 的 记录 。3 种 最 主要 的 文件 组 织 类 型 包括 : 1) 
顺序 ， 根 据 主键 值 顺序 地 存放 记录 ; 2) 索引 的 ， 记 录 以 任意 的 方式 存储 ， 使 用 索引 来 定位 存 
储 记录 的 位 置 ，3) 散 列 的 ， 记 录 存 储 的 位 置 是 通过 散 列 算法 将 主键 的 值 转化 为 记录 地 址 而 确 
定 的 。 多 种 类 型 的 物理 记录 可 以 存放 在 一 个 物理 文件 的 聚 入 上 ， 这 样 就 可 以 使 经 常 一 起 使 用 的 
记录 在 二 级 存储 中 邻接 存放 。 

索引 文件 组 织 是 目前 使 用 最 广泛 的 方法 之 一 。 一 个 索引 可 以 创建 在 惟一 键 上 ， 也 可 以 创建 
在 辅 键 〈 非 惟一 键 ) 上 ， 此 时 一 个 键 值 可 以 对 应 多 个 记录 。 还 可 以 使 用 一 种 新 形式 的 索引 ， 即 
位 图 索引 ， 来 创建 位 表 ， 其 中 的 一 位 表明 对 应 记录 具有 相关 的 键 值 。 一 个 联结 索引 代表 来 自 两 
个 〈 多 个 ) 不 同 表 ， 但 在 某 个 字段 上 有 相同 值 的 行 。 散 列 索引 表 使 得 数据 的 存放 和 和 散 列 算法 无 
关 ， 这 样 可 以 通过 在 在 不 同 字段 上 分 别 建立 散 列 函 数 来 访问 相同 的 数据 。 索 引 对 于 加 快 数据 读 
取 非 常 重要 ， 尤 其 是 应 用 多 个 条 件 来 对 数据 进行 选择 、 排 序 和 联结 时 更 是 如 此 。 索 引 在 很 多 情 
况 下 都 有 显著 的 作用 ， 这 些 情况 包括 使 用 大 的 表 、 经 常用 来 为 查询 设 定 条 件 的 列 、 包 含有 大 量 
不 同 值 的 列 和 数据 读 取 而 不 是 数据 维护 占 主导 的 场合 。 

可 以 使 用 廉价 元 余 磁 盘 阵 列 来 提高 文件 访问 的 效率 和 可 靠 性 。RAID 人 允许 多 个 程序 的 数据 
块 在 不 同 的 磁盘 上 并 行 地 读 和 写 ， 这 比 传统 磁盘 上 的 顺序 1//O 操 作 的 效率 提高 很 多 。 多 种 RAID 
层次 的 存在 ， 使 得 文件 和 数据 库 设 计 人 员 可 以 结合 访问 效率 、 空 间 利用 率 和 容错 等 因素 来 为 数 
据 库 应 用 作出 最 适当 的 选择 。 

目前 使 用 的 数据 库 体系 结构 包括 层次 、 网 状 、 关 系 、 面 向 对 象 和 多 维 。 层 次 和 网 状 数据 库 
系统 主要 应 用 在 遗留 系统 中 ， 而 关系 、 面 向 对 象 和 多 维 是 新 系统 开发 所 使 用 的 数据 库 体系 结构 。 

对 于 多 处 理 器 的 数据 库 服务 器 的 介绍 表明 ， 它 们 将 为 数据 库 管理 系统 提供 新 的 功能 。 其 中 








一 个 主要 的 新 特性 是 可 以 将 查询 分 解 开 来 ， 并 行 地 在 表 的 数据 段 上 运行 查询 。 这 种 并 行 查询 的 
处 理 能 力 可 以 极 大 地 提高 查询 的 处 理 速度 。 程 序 员 通过 提供 DBMS 执 行 数据 操作 的 顺序 的 提示 
来 提高 数据 库 的 性 能 ， 这 些 提 示 可 以 修正 数据 库 内 基于 代价 的 优化 器 的 结果 。DBMS 和 程序 员 
都 可 以 通过 对 数据 库 统 计数 据 的 研究 来 确定 查询 的 处 理 方法 ， 本 章 中 同时 介绍 了 一 些 如 何 设计 
良好 查询 的 建议 。 

本 章 总 结 全 书 对 于 数据 库 设计 的 讨论 。 在 完成 全 部 的 物理 数据 库 设计 规格 说 明 以 后 ， 读 者 
在 后 面 会 开始 使 用 数据 库 技术 来 实现 数据 库 。 实 现 意味 着 定义 数据 库 ， 编 写 服务 器 和 客户 端 程 
序 以 处 理 数 据 库 上 的 查询 、 报 表 和 事务 。 这 是 后 面 5 章 的 主要 内 容 ， 其 中 涉及 到 关系 数据 库 在 
客户 平台 、 服 务 器 平台 和 客户 /服务 器 环境 的 实现 ， 以 及 数据 仓库 的 技术 。 








本 章 复习 
关键 术语 
位 图 索引 块 因子 数据 类 型 
非 规范 化 区 字段 
文件 组 织 散 列 索引 表 散 列 文件 组 织 
散 列 算法 水 平分 割 索引 
索引 文件 组 织 联结 索引 页 
物理 文件 物理 记录 指针 
廉价 元 余 磁 盘 阵 列 (RAID ) 辅 键 顺序 文件 组 织 
条 表 空 间 垂直 分 割 
复习 问题 
1. 定义 以 下 术语 。 
a. 文件 组 织 b. 顺序 文件 组 织 
c. 索引 文件 组 织 d. 散 列 文件 组 织 
e. 非 规范 化 f. 索引 
g. 辅 键 h. 数据 类 型 
i 位 图 索引 j. RAID 
k. 联结 索引 1. 条 
2. 将 术语 和 它 的 定义 匹配 起 来 。 
一 一 位 图 索引 a. 一 个 IO 操作 所 读 取 的 数据 
一 ” 散 列 算法 b. 一 页 中 的 记录 数 
页 c. 命名 的 二 级 存储 区 域 
一 一 物理 记录 d. 值 为 0 或 1 的 表 
指针 e. 不 包含 业务 数据 的 字段 
一 块 因子 f. 将 键 值 转化 为 地 址 
一 物理 文件 g. 邻接 的 字段 
3. 比较 以 下 的 术语 。 
a. 水 平分 割 ; 垂直 分 割 b. 物理 文件 ; 表 空 间 
c. 物理 记录 ; 物理 文件 d. 页 ; 物理 记录 
e. 辅 键 ; 主键 ， 


4. 物理 数据 库 设计 的 主要 输入 是 什么 ? 
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5. 物理 数据 库 设 计 中 的 关键 决策 有 哪些 ? 
6. 在 复合 使 用 图 中 有 哪些 信息 ? 
7. 当 开 发 字段 规格 说 明 时 ， 需 要 做 出 哪些 决策 ? 
8. 为 字段 选择 数据 类 型 的 目标 是 什么 ? 
9. 为 什么 字段 值 被 编码 或 压缩 ? 
10. 有 哪些 用 于 控制 字段 完整 性 的 选项 ? 
11. 描述 3 种 处 理 缺 失 值 的 方法 。 
12. 说 明 为 什么 规范 化 的 关系 不 一 定 是 效率 高 的 物理 记录 。 
13. 列举 3 种 适 于 通过 非 规 范 化 来 组 成 物理 记录 的 情况 。 
14. 水 平分 割 和 物理 分 割 的 优 缺 点 是 什么 ? 
15. 列举 选择 文件 组 织 要 考虑 的 7 个 重要 因素 。 
16. 位 图 索引 在 什么 情况 下 适用 ? 
17. 散 列 索引 表 的 优点 是 什么 ? 
18. 数据 存放 在 聚 丛 上 的 目的 是 什么 ? 
19. 列举 选取 索引 的 7 条 经 验 。 
20. 比较 两 种 看 待 多 维 数 据 库 的 方法 。 
21. 如 何 使 用 EXPLAIN 来 编写 高 效率 的 查询 ? 
22. 解释 4 个 用 来 优化 查询 性 能 的 选项 。 
23. 哪个 层次 的 RAID 最 好 ?为 什么 ? 
问题 和 练习 
1. 考虑 下 面 两 个 Millennium 学 院 的 关系 : 
STUDENT (Student_IDp,Student Name, Campus_ Address ,GPA) 
REGISTRATION ( Student 1D,Course 1D,Grade) 
这 是 一 个 针对 这 些 关系 的 典型 查询 : 
SELECT STUDENT .STUDENT 1D, STUDENT NAME, 
COURSE_ID, GRADE 
FROM STUDENT, REGISTRATION 
WHERE STUDENT .STUDENT_ID = REGISTRATION .STUDENT_ID 
AND GPA > 3.0 
ORDER BY STUDENT_ NAME; 


a. 应 该 在 哪些 属性 上 创建 索引 以 提高 查询 效率 ”说 明 选 择 这 些 属性 的 理由 。 
b. 为 前 面 创建 的 索引 写 出 SQL 语 句 。 
2. 参考 图 6-1 中 的 复合 使 用 图 。 在 一 段 时 间 后 ， 对 于 该 图 的 假设 发 生 以 下 变化 
a. 每 个 供 货 商 大 约 有 40 个 报价 (而 不 是 50 个 )。 
b. 自行 生产 的 零件 只 占 到 总 数 的 30% ， 而 购买 的 零件 占 到 75%。 
<. 每 小 时 对 于 购买 零件 的 直接 访问 增加 到 75 次 (而 不 是 60 次 )。 
画 出 新 的 使 用 图 以 体现 数据 变化 。 
3. 为 图 6-4 中 的 规范 化 关系 属性 选择 适当 的 Oracle 数 据 类 型 。 
4. 假设 读者 要 为 所 在 大 学 的 学 生 记录 的 年 龄 字段 设置 默认 值 ， 那 么 会 选择 什么 值 7 为 什么 
选 定 它 ? 在 考虑 到 学 生 的 其 他 特征 (如 不 同 的 学 院 或 不 同 的 学 位 ) 时 ， 默 认 值 会 如 何 变化 ? 
5. 如 果 学 生 没 有 选 定 专业 ， 校 方 通常 会 在 专业 字段 输入 “未 决定 ”, .此 时 “未 决定 ”代表 
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的 是 默认 值 还 是 空 值 ? 
6. 郑 虑 以 下 大 型 零售 连锁 店 数据 库 中 的 规范 化 关系 : 


STORE (Store_1ID, Region. Manager ID. Square Feet) 





你 会 考虑 创建 这 种 非 规范 化 的 记录 ? 

7. 读者 有 一 个 硬盘 文件 ， 它 用 来 存储 最 多 1000 条 ， 每 条 长 240 字 节 的 记录 。 假 设 一 页 的 长 
度 是 4000 字 节 ， 且 记录 不 可 以 跨 页 。 那 么 这 个 文件 需 旨 多 少 字 和 的 存储 空间 ? 

8. 将 关系 垂直 分 割 可 能 带 来 哪些 问题 ? 考虑 到 这 些 潜 在 的 问题 ， 哪 些 因 素 决 定 着 何 时 进行 
垂直 分 割 ? 

9. 是 否 可 能 在 一 个 顺序 文件 上 根据 多 个 排列 顺序 来 对 数据 进行 顺序 扫描 ?》 如 果 不 可 以 ， 为 
什么 ?如 果 可 以 ， 应 怎样 操作 ? 

10. 假设 文件 内 的 记录 按照 键 序 ， 使 用 指针 和 前 面 、 后 面 的 记录 联结 。 这 样 每 条 记录 的 形 
式 可 能 是 : 

主键 、 其 他 属性 、 指 向 前 面 记录 的 指针 、 指 向 后 面 记录 的 指针 

a. 和 顺序 文件 组 织 相 比 ， 这 种 方式 有 什么 优点 ? 
b. 和 顺序 文件 组 织 相 比 ， 这 种 方式 是 否 可 以 以 多 个 顺序 访问 记录 ?为 什么 ? 

11. 假设 在 大 学 数据 库 中 的 学 生 文件 上 ， 分 别 在 字段 Student_ID (主键 ) 以 及 Major、Age、 
Marital_Status 和 Home_Zipcode (都 是 辅 键 ) 上 设置 索引 。 如 果 学 校 要 查询 专业 为 MIS 或 计算 机 
科学 、 年 龄 超过 25 岁 且 已 婚 的 学 生 或 是 专业 为 计算 机 工程 、 单 身 且 邮政 编码 是 45462 的 学 生 ， 
那么 应 该 如 何 使 用 索引 ， 使 得 用 户 只 访问 满足 这 些 条 件 的 记录 ? 

12. 再 次 考虑 上 题 中 所 提 到 的 学 生 文 件 ， 哪 个 索引 比较 适合 使 用 位 图 索引 ? 要 满足 什么 样 
的 条 件 使 用 这 个 位 图 索引 才 有 意义 ”按照 图 6-8 的 形式 ， 选 择 可 能 创建 位 图 索引 的 键 ， 并 曾 图 。 

13. 为 图 5-4 中 的 表 CUSTOMER 和 ORDER 在 字段 Customer_ID 上 创建 联结 索引 。 

14. 考虑 图 6-7c， 假 设 这 个 索引 中 叶 的 空 行 是 用 来 存放 新 记录 的 ， 那 么 解释 -下 记录 
Sooners” 会 放 在 娜 里 ， 记 录 “Flashes” 又 会 放 在 哪里 。 当 某 个 叶 已 经 放 满 ， 而 又 有 新 的 记录 
要 加 到 它 上 面 时 会 发 生 什么 情况 ? 

15. 考虑 图 6-12 中 对 于 流行 的 数据 库 体系 结构 的 特征 比较 。 给 出 和 图 中 的 多 维 数据 模型 相 
等 价 的 关系 。 

16. 在 文件 已 经 加 载 记录 后 ， 还 可 以 对 文件 进行 聚 侯 操作 吗 ? 为 什么 ? 

17. 在 本 章 介绍 的 并 行 查询 处 理 中 ， 一 个 查询 在 多 个 处 理 器 上 运行 ， 每 个 处 理 器 并 行 地 访 
问 数据 库 的 不 同 子 集 。 另 一 种 本 章 中 没有 提 及 的 并 行 查询 处 理 形式 是 ， 分 解 查询 以 使 查询 的 各 
个 部 分 运行 在 不 同 的 处 理 器 上 ， 同 时 允许 每 个 部 分 访问 任何 它 需要 的 数据 。 大 多 数 的 查询 都 包 
含 子 句 来 选择 限定 的 记录 。 比 如 ， 限 定子 句 的 形式 为 : 

(condition OR condition OR .….) RND (condition OR condition OR .….)aAND ..…- 

考虑 这 种 一 般 化 的 形式 ,此 时 应 该 如 何 分 解 查 询 , 以 使 并 行 处 理 器 可 以 分 别处 理 部 分 查询 ， 
并 在 每 个 部 分 的 处 理 结束 后 再 将 它们 结合 起 来 ? 

18. 在 图 6-11f 中 ， 假 设 记录 2、3、7 和 9 被 4 个 不 同 的 用 户 同时 更 新 ， 哪 些 记录 可 以 并 行 更 
新 ? 给 出 一 个 更 新 操作 的 调度 以 使 并 行 最 大 化 。 
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应 用 练习 

1. 了 解 学 校 里 提供 给 学 生 使 用 哪 种 DBMS ， 以 及 它们 支持 何 种 数据 类 型 。 依 据 对 数据 类 型 
的 支持 情况 比较 不 同 的 DBMS ， 并 判断 它们 分 别 适用 于 哪些 应 用 。 

2. 使 用 本 书 提供 的 Web 资 源 和 其 他 因特网 信息 , 调查 不 同 数据 库 管 理 系统 的 并 行 处 理 功能 。 
它们 的 功能 有 什么 不 同 ? 

3. 使 用 本 书 提供 的 web 资源 和 因特网 信息 ， 了 解 面向 对 象 数据 库 系统 的 功能 。 它 们 的 价格 
是 多 少 ? 供应 商 推荐 在 哪些 应 用 领域 使 用 它们 的 产品 ? 

4. 和 组 织 内 熟悉 的 数据 库 设 计 人 员 或 管理 人 员 交 流 ， 了 解 他 们 所 使 用 数据 库 系 统 支持 的 文 
件 组 织 方法 ， 询 问 他 们 在 选择 文件 组 织 类 型 时 要 考虑 哪些 因素 。 对 于 索引 文件 ， 向 他 们 请 教 是 
如 何 选 定 索引 的 ， 索 引 是 否 被 删除 过 ? 为 什么 ? 

5. 咨询 组 织 内 熟悉 的 数据 库 设 计 人 员 或 管理 人 员 ， 他 们 是 否 在 组 织 的 数据 库 中 使 用 RAID 
技术 ? 说 明 使 用 或 不 使 用 的 原因 。 如 果 已 经 使 用 ， 他 们 使 用 的 是 哪个 层次 的 RAID? 为 什么 ? 
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项 目 案例 : 山 景 社 区 医院 


在 前 面 几 章 中 ， 读 者 已 经 为 山 景 社区 医院 开发 了 数据 库 系统 。 基 于 第 3 章 、 第 4 章 、 第 5 章 
中 开发 的 概念 和 关系 数据 库 ， 现 在 要 为 它 进 行 相应 的 物理 数据 库 设 计 。 

项 目 描述 

山 景 社区 医院 已 经 决定 使 用 关系 数据 库 管理 系统 Oracle 来 开发 数据 库 ， 因 此 物理 数据 库 的 
设计 必须 利用 Oracle 所 提供 的 功能 (如 果 读 者 对 Oracle 不 熟悉 ， 那 么 可 以 假定 系统 使 用 你 熟悉 
的 DBMS ， 然 后 回答 下 面 的 问题 )。 

项 目 问题 

1) 除 在 第 5 章 项 目 案例 中 获得 的 为 第 3 章 中 概念 数据 库 所 开发 的 3NF 关 系 以 外 ， 还 需要 哪些 
信息 来 进行 相应 的 物理 数据 库 设 计 ? 

2) 是 否 可 能 在 数据 库 中 使 用 水 平和 垂直 分 割 ? 如 果 无 法 确定 ， 那 么 还 需要 哪些 信息 才能 确 
切 地 回答 这 个 问题 ? 

3) 图 6-13 给 出 部 分 山 景 社区 医院 数据 库 的 初始 复合 使 用 图 。 在 此 以 后 ， 一 些 关 于 数据 库 使 
用 情况 的 假设 已 经 发 生变 化 : 

* 每 个 病人 大 约 消费 12 个 (而 不 是 10 个 ) 项 目 。 

“每 小 时 大 约 访 问 病人 治疗 效果 数据 40 次 (而 不 是 30 次 )， 而 且 同 时 会 访问 相应 的 治疗 办 

法 。 

重 画 图 6-13 以 反映 新 的 信息 。 
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项 目 练习 

1) 在 第 5 章 的 项 目 练习 5 中 ， 读 者 已 经 为 逻辑 设计 中 的 每 个 关系 写 出 了 相应 的 CREATE 
TABLE 命 令 。 在 完全 了 解数 据 库 管理 系统 (如 Oracle) 所 提供 的 物理 数据 库 设计 选项 后 ， 重 新 
考虑 前 面 给 出 的 CREATE TABLE 语 句 ， 并 回答 以 下 问题 : 

a. 是 否 会 为 字段 选择 新 的 数据 类 型 ”为 什么 ? 

b. 是 否 有 应 该 被 编码 的 字段 ”如 果 有 ， 你 会 使 用 何 种 编码 方案 ? 

c. 哪些 字段 可 以 取 空 值 ? 

d. 假如 进行 治疗 的 日 期 没有 输入 ， 你 会 采取 什么 步骤 来 处 理 这 些 缺 失 的 值 7 是否 应 该 为 
这 个 字段 提供 默认 值 ? 为 什么 ? 

2) 在 项 目 问题 2 中， 询问 读者 是 否 要 进行 数据 分 割 。 除 分 割 以 外 ， 是 否 有 进行 其 他 非 规范 
化 操作 的 可 能 性 ? 如 果 没 有 ， 为 什么 ?》 如 果 有 ， 应 在 哪里 和 如 何 进行 非 规范 化 ? 

3) 在 项 目 问题 3 中 ， 读 者 已 经 更 新 了 图 6-13 中 的 山 景 社区 医院 数据 库 的 复合 使 用 图 。 观 察 
修正 后 的 图 ， 是 否 有 对 来 自 两 个 或 多 个 表 的 行使 用 聚 往 的 可 能 性 ? 为 什么 ? 

4) 为 山 景 社区 医院 数据 库 的 每 个 表 写 出 创建 主键 索引 的 CREATE INDEX 语 句 。 

5) 考虑 下 面 山 景 社区 医院 数据 库 上 的 查询 语句 : 对 过 去 两 周 的 每 次 治疗 效果 数据 ， 按 照 
Treatment ID 排序 显示 ; 若 Treatment ID 相同 ， 按 照 日 期 反 向 排序 ， 并 列 出 执行 治疗 的 医生 ( 按 
照 治 疗 分 组 ) 和 这 个 医生 在 当天 进行 同样 治疗 的 次 数 。 为 改善 这 个 查询 的 性 能 ， 请 读者 建立 畏 
键 索引 ， 并 在 需要 时 做 出 合理 的 假设 。 





概要 


第 四 部 分 讨论 与 实现 关系 数据 库 系统 相关 的 主题 ， 包括 支持 Web 的 因特网 应 用 ， 以 及 数据 
仓库 。 正 如 第 2 章 中 所 指出 的 ， 数 据 库 实 现 包括 : 编写 和 测试 数据 库 处 理 程序 、 完 成 数据 库 文 
档 和 培训 材料 、 安 装 数据 库 和 (如 有 必要 ) 从 以 前 的 系统 中 转换 数据 。 现 在 终于 到 了 系统 开发 
生命 周期 的 关键 点 ， 我 们 一 直 在 为 该 系统 开发 生命 周期 而 做 准备 。 我 们 前 面 所 进行 的 活动 ， 如 
企业 建 模 、 概 念 数据 建 模 、 软 辑 与 物理 数据 设计 是 必要 的 前 期 阶段 。 在 系统 实现 的 后 期 ， 我们 
期 望 得 到 满足 用 户 信 息 需 求 的 功能 系统 。 此 后 ， 系 统 投 入 实际 使 用 ， 为 使 系统 正常 工作 ， 还 要 
进行 必要 的 系统 维护 。 第 四 部 分 中 的 各 章 将 有 助 于 我 们 初步 认识 实现 数据 库 系统 的 复杂 性 和 挑 
战 性 。 

第 7 章 讨 论 SQL (Structured Query Language， 结 构 化 查询 语言 )，SQL 已 经 成 为 创建 和 处 理 
关系 数据 库 的 标准 语言 (特别 是 在 数据 库 服务 器 中 )。 本 章 简要 介绍 了 SQL 的 发 展 史 ， 包 括 对 
目前 大 部 分 DBMS 使 用 的 SQL-92 的 全 面 介 绍 ， 还 讨论 了 当前 正在 实现 的 SQL-99 标 准 ， 以 及 
SQL 的 语法 。 该 章 还 介绍 了 创建 数据 库 的 数据 定义 语言 (DDL )、 用 于 查询 数据 库 的 单个 表 的 
数据 操纵 语言 (DML)。 动 态 视图 (dynamic view) 和 物化 视图 (materialized view ) 的 内 容 也 
在 该 章 中 加 以 介绍 ， 它 们 用 于 约束 用 户 的 环境 到 相关 的 表 上 去 ， 这 些 表 对 于 完成 用 户 工作 来 说 
很 有 必要 。 

第 8 章 继续 解释 了 更 高 级 的 SQL 语法 和 结构 。 展 示 了 多 表 查 询 、 子 查询 和 相关 子 查询 ， 这 
些 功能 使 SQL 的 功能 更 为 强大 。 对 事务 完整 性 问题 和 数据 词典 构造 的 解释 ， 将 SQL 放置 在 更 为 
广阔 的 上 下 文中 。 其 他 的 一 些 编程 功能 ， 包 括 触 发 颖 、 存储 过 程 和 用 在 其 他 编程 语言 程序 中 的 
嵌入 式 SQL， 更 进一步 地 展示 SQL 的 功能 。SQL-99 中 联机 分 析 处 理 (OLAP) 的 特性 也 在 该 章 
中 加 以 介绍 ， 它 对 数据 仓库 的 访问 很 有 必要 。 

第 9 章 讨 论 了 客户 /服务 器 的 体系 结构 、 应 用 程序 、 中 间 件 和 在 当今 数据 库 环 境 中 对 客户 机 
数据 库 的 访问 。 理解 这 一 章 的 内 容 很 重要 ， 因为 它 是 理解 第 10 章 将 要 讨论 的 因特网 主题 的 基础 。 
该 章 还 讨论 了 多 层 体系 结构 ， 包 括 应 用 服务 器 和 数据 库 服务 器 、 分 布 在 各 层 的 数据 库 处 理 选 择 
件 , 使 用 浏览 器 的 ( 瘦 ) 客户 。 这 一 章 中 , 支持 Web 的 数据 库 的 安全 性 以 及 ODBC 和 JDBC 连 接 ， 
这 些 内 容 为 即将 讨论 的 因特网 主题 奠定 了 基础 。 

第 10 章 描述 了 基于 Web 的 应 用 到 数据 库 的 连接 。 本 章 为 那些 不 熟悉 Web 的 人 介绍 了 因特网 
方面 的 术语 。 脚 本 语言 的 使 用 ， 在 脚本 中 使 用 嵌入 式 SQL 的 内 容 也 在 该 章 中 加 以 介绍 。 该 章 包 
括 了 一 个 简单 购物 车 应 用 程序 ， 它 用 ASP 和 ColdFusion 两 种 方法 实现 。 安 装 和 运行 购物 车 的 整 
个 代码 和 文档 都 可 以 在 本 书 的 网 站 中 找到 。 要 想 了 解 如 何 建立 一 个 支持 Web 的 数据 库 应 用 程序 ， 
就 应 该 仔细 研究 这 些 代 码 。 该 章 还 介绍 了 Web 服 务 器 的 作用 、 用 于 数据 库 连 接 的 服务 器 端 扩展 ， 
以 及 Web 的 安全 性 问题 。 

第 11 章 描述 了 数据 仓库 的 基本 概念 , 为 什么 数据 仓库 被 许多 企业 认为 是 在 竞争 取胜 的 关键 ， 
以 及 数据 仓库 中 特有 的 数据 库 设 计 活 动 和 结构 。 该 章 的 主题 包括 : 各 种 数据 仓库 体系 结构 、 数 
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据 转 换 和 数据 调和 技术 ， 以 及 用 于 数据 仓库 的 多 维 数据 模型 〈《 星 型 模式 )。 此 外 还 解释 和 举例 
说 明了 用 于 数据 集 市 的 数据 库 设计 ， 包 括 代理 键 、 事 实 表 粒 度 、 日 期 和 时 间 建 模 、 维 的 一 致 性 、 
无 事实 的 事实 表 ， 以 及 帮助 /层次 /引用 表 。 

正如 前 面 对 各 章 介绍 所 指出 的 ， 第 四 部 分 既 提 供 了 在 实现 数据 库 应 用 中 出 现 的 问题 的 概念 
理解 ， 也 介绍 了 建立 一 个 数据 库 原型 所 必须 的 过 程 。 我 们 对 最 新 发 展 动向 的 介绍 ， 如 客户 / 服 
务 器 、 支 持 Web、 数 据 仓库 等 可 使 读者 了 解 到 数据 库 的 未 来 发 展 方向 。 





第 7 章 SQL 


7.1 学 习 目标 
学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 
“定义 下 列 关键 术语 ; 关系 数据 库 管理 系统 (RDBMS )、 目 录 、 模 式 、 数 据 定义 语言 、 数 
据 操纵 语言 、 数 据 控制 语言 、 基 表 、 动 态 视图 、 物 化 视图 、 参 照 完整 性 、 标 量 聚 合 以 及 
向 量 聚合 。 
“ 解释 在 数据 库 发 展 过 程 中 SQL 的 历史 和 作用 。 
“使 用 SQL 数据 定义 语言 定义 数据 库 。 
“ 使 用 SQL 命令 查询 单个 表 。 
“使 用 SQL 建立 参照 完整 性 。 
。 讨 论 SQL-92 和 SQL-99 标 准 。 


7.2 引言 


有 人 把 SQL 读 作 “S-Q-L”， 也 有 人 把 SQL 读 作 “seguel" ， 但 无 论 如 何 ，SQL 已 成 为 创建 和 
查询 关系 数据 库 事 实 上 的 标准 语言 。 本 章 的 主要 目的 是 深入 讨论 SQL。SQL 是 关系 系统 最 常用 
的 语言 ， 它 已 被 美国 国家 标准 化 组 织 (American National Standards Institute ，ANSI) 接受 成 为 
美国 标准 ， 同 时 它 也 是 联邦 信息 处 理 标准 (Federal Information Processing Standard，FIPS ) ， 
此 外 它 还 被 国际 标准 化 组 织 (ISO) 认定 为 国际 标准 。 

ANSI SQL 标准 在 1986 年 首次 发 布 ， 并 在 1989、1992 (SQL-92) 和 1999 (SQL-99) 年 进行 
了 更 新 。SQL-92 有 三 个 层次 : 入 门 级 、 中 间 级 和 完全 级 ， 而 SQL-99 在 SQL-92 的 基础 上 进行 了 
重大 扩展 。SQL-99 建 立 了 核心 层 一 臻 性， 核心 层 一 致 性 必须 先 于 其 他 一 致 性 得 到 满足 。 目 前 ， 
在 SQL-99 中 指定 了 八 种 类 型 的 一 致 性 ， 包 括 活动 数据 库 、 增 强 的 完整 性 管理 和 基本 对 象 支持 
等 。 在 本 书写 作 之 时 ， 大 部 分 数据 库 管 理 系统 与 人 门 级 SQL-92 相 容 ， 且 正在 朝 着 与 核心 SQL- 
99 相 容 的 目标 而 努力 。 例 如 ，Oracle 8i 支 持 入 门 级 SQL-92， 且 基本 与 核心 SQL-99 兼 容 。 除 标 
记 为 Oracle SQL 或 Microsoft Access SQL， 本 章 的 例子 都 遵循 SQL 标 准 。 

SQL 已 经 在 大 型 机 和 个 人 计算 机 系统 上 得 到 实现 ， 因 此 本 章 内 容 与 这 两 种 计算 环境 有 关 。 
虽然 许多 PC 数据 库 包 使 用 一 种 按 例 查 询 (Query-By-Example，QBE) 的 接口 ， 它 们 同时 也 把 
SQL 作 为 可 选项 。 例 如， 在 Microsoft Access 中 ， 可 以 在 这 两 个 接口 之 间 来 回 切换 ， 按 一 下 按钮 ， 
可 以 把 使 用 QBE 接 口 建 立 起 来 的 查询 用 SQL 的 形式 显示 出 来 ， 这 一 特性 可 以 帮助 读者 学 习 SQL 
语法 。 在 客户 /服务 器 体系 结构 中 ，SQL 命 令 在 服务 器 上 执行 ， 结 果 返 回 给 客户 工作 站 。 

1979 年 面世 的 Oracle 是 第 一 个 支持 SQL 的 商用 DBMS 。Oracle 现 在 可 用 于 大 型 机 、 客户 / 服 
务 器 以 及 PC 有 平台， 适合 于 各 种 操作 系统 ， 包 括 OS/390(MVS)、 各 种 UNIX 操 作 系 统 、Linux、 
Microsoft Windows 和 Windows NT、VAX/VMS， 以 及 VM/CMS。 IBM 的 DB2、Informix 以 及 
Sybase 也 适用 于 这 些 操作 系统 。Microsoft SQL Server 2000 运 行 于 Windows NT 和 Windows 2000 








上 ， 个 人 版 运行 于 Windows 98、Windows NT、Windows 2000、Windows Me 上。 

核心 SQL-99 包 含 入 门 级 SQL-92 和 其 他 一 些 功 能 ， 因 此 供应 商 正 在 从 入 门 级 的 SQL-92 转 入 
兼容 核心 SQL-99。 已 有 几 个 文档 发 布 了 相关 的 标准 ， 它 们 详细 地 说 明了 除了 核心 SQL-99 之 外 ， 
还 可 实现 的 增强 级 别 ， 这 使 得 SQL 除了 可 用 于 当前 所 支持 的 关系 数据 库 外 ， 还 可 用 于 支持 对 象 
数据 库 中 持久 的 、 复 杂 的 对 象 。 本 章 我 们 使 用 Oracle 8i SQL*Plus， 它 与 人 门 级 SQL-92 相 容 ， 
且 正 在 向 核心 SQL-99 靠 拢 。 在 本 书写 作 之 时 ，SQLs*Plus 不 与 核心 SQL-99 相 容 ， 但 Oracle 已 声 
称 ， 它 不 久 将 支持 核心 SQL-99。 


7.3 SQL 标准 的 发 展 


1970 年 ，E. F. Codd 在 一 篇 名 为 “A Relational Model of Data for Large Shared Data Banks” 
的 经 典 论文 中 ， 首 次 明确 提出 了 关系 数据 库 技术 的 概念 。 在 加 利 福 尼 亚 圣 约 瑟 的 IBM 研 究 实验 
室 的 工作 人 员 承 担 了 System R 的 开发 工作 ， 这 个 项 目 是 论证 在 数据 库 管理 系统 中 实现 关系 模型 
的 可 行 性 。 他 们 使 用 了 一 种 称 为 “Sequel” 的 语言 ， 这 种 语言 也 是 由 圣 约 瑟 的 IBM 研 究 实验 室 
开发 的 。 该 项 目 从 1974 年 开始 至 1979 年 结束 ， 期 间 , “Sequel” 被 重新 命名 为 SQL。 后 来 ,在 
该 项 目 中 所 获取 的 知识 被 应 用 到 SQL/DS 的 开发 ， 这 是 IBM 开 发 的 第 一 个 可 商用 的 关系 数据 库 
管理 系统 。1981 年 ，SQL/DS 第 一 次 实现 ， 它 运行 在 DOS/VSE 操 作 系 统 上 。 在 1982 年 推出 了 
VM 版 ，1983 推 出 了 MVS 版 DB2。 

由 于 System R 在 所 安装 的 用 户 结 点 那里 受到 好 评 ， 所 以 其 他 厂商 开始 开发 使 用 SQL 的 关系 
产品 。 其 中 的 一 个 产品 ， 来 自 Relational Software 的 Oracle， 实际 上 比 SQL/DS 先 上 市 (1979 年 )。 
此 外 还 有 一 些 其 他 产品 ， 包 括 来 自 Relational Technology 的 INGRES (1981 年 )、Britton-Lee 的 
IDM (1982 年 )、Data General Corporation 的 DG/SQL， 以 及 Sybase 公司 的 Sybase (1986)。 为 了 
指导 RDBMS 开 发 ， ANSI 和 ISO 颁布 了 一 种 用 于 SQL 关系 查询 语言 (函数 和 语法 ) 的 标准 ， 该 
标准 常 称 为 SQL/86， 它 最 初 是 由 数据 库 技 术 委 员 会 X3H2 提 出 的 (数据 库 技术 委员 会 X3H2， 
1986; ISO, 1987)。 到 了 1989 年 ，1986 年 的 标准 进行 了 扩展 ， 它 包 括 一 个 可 选 的 完整 性 增强 特 
征 (Integrity Enhancement Feature, IEF), 人 们 常 称 之 为 SQL/89。 同 样 在 1989 年 ， 美国 还 颁布 
了 一 个 相关 的 标准 ， 称 为 数据 库 语 言 嵌 入 式 SQL (Database Language Embedded SQL, ESQL ) 。 
ISO 和 ANSI 委 员 会 创建 了 式 SQL-92 (数据 库 技术 委员 会 X3H2， 1989; ISO, 1989, 1991), 它 
对 SQL/86 作 了 更 进一步 的 扩展 。1992 年 底 ， SQL-92 标 准 颁布 ， 这 就 是 著名 的 国际 标准 ISO/IEC 
9075:1992， 数 据 库 语 言 SQL。 1994 年 和 1996 年 SQL-92 进 行 了 修正 ， 1999 年 7 月 ， SQL-99 标 准 
颁布 。 

目前 有 许多 产品 支持 SQL， 它们 在 从 个 人 计算 机 到 大 型 主机 的 各 种 机 器 上 运行 。 数据 库 市 
场 正 走向 成 熟 ， 产 品 进行 重大 变革 的 速度 减 慢 ， 但 它们 将 继续 基于 SQL。1999 年 ，Oracle、 
IBM 和 Microsoft 共 占有 全 部 数据 库 市 场 73% 以 上 的 份额 (Gartner Dataquest 发 布 ， 1999 年 5 月 3 
日 )。 其 中 ，Oracle 和 IBM 各 自控 制 大 约 30% 的 市 场 。 最 近 ， 电子 商务 应 用 和 客户 关系 管理 
(Customer Relationship Management, CRM) 系统 的 增长 促进 了 一 些 规模 较 大 的 厂商 的 发 展 ， 
但 是 Gartner Dataquest 认 为 ， 在 一 些 特定 行业 的 系统 和 小 的 应 用 中 ， 规 模 较 小 的 广 商 仍 有 发 展 
壮大 的 机 会 。 当 你 读 这 本 书 的 时 候 ， 某 些 即将 发 布 的 产品 或 许 会 改变 数据 库 管 理 系统 的 相对 布 
局 , 但 所 有 产品 还 将 继续 使 用 SQL， 它们 在 一 定 程度 上 遵循 后 面 描述 的 标准 。 


7.4 数据 库 体系 结构 中 SQL 的 作用 
目前 ， 由 于 有 了 关系 DBMS 和 应 用 程序 生成 器 ， 应 用 程序 用 户 普遍 对 数据 库 体系 结构 中 
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SQL 的 重要 性 不 太 清 楚 ， 许 多 用 户 在 根本 不 了 解 SQL 情 况 下 访问 数据 库 应 用 程序 。 例 如 ，Web 
站 点 允许 用 户 浏览 正在 访问 的 站 点 的 目录 (比如 在 http:Wwww.Hbean.com)。 某 个 项 目 所 呈现 的 
信息 ， 如 大 小 、 颜 色 、 描 述 及 可 用 性 ， 都 存储 在 数据 库 中 。 这 些 信 息 是 使 用 SQL 查询 检索 得 来 
的 ， 但 用 户 此 时 不 必 发 出 SQL 命令 。 

基于 SQL 的 关系 数据 库 应 用 程序 涉及 到 用 户 的 界面 和 带 有 SQL 功能 的 关系 数据 库 管 理 系统 
(Relational DBMS，RDBMS)。 在 RDBMS 中 、SQL 常 用 于 创建 表 、 翻 译 用 户 要 求 、 维 护 数 据 
词典 和 系统 目录 、 更 新 和 维护 表 、 建 立 安 全 机 制 以 及 执行 备份 和 恢复 过 程 。 关 系 DBMS 
(RDBMS ) 是 一 个 实现 关系 数据 模型 的 数据 管理 系统 ， 在 关系 数据 模型 中 ， 数 据 存储 在 一 系列 
表 中 ， 数 据 之 间 的 联系 用 公共 数值 表示 ， 而 不 是 由 链接 表示 。 第 3 章 的 松 谷 家 具 数 据 库 系统 例 
子 说 明 这 种 数据 观点 。 本 章 SQL 查 询 都 将 使 用 这 个 例子 。 

SQL 标准 的 最 初 目 的 是 : 

1) 指定 SQL 数据 定义 和 数据 操纵 语言 的 语法 和 语义 。 

2) 为 设计 、 访 问 、 维 护 、 控 制 和 保护 SQL 数据 库 ， 定 义 数 据 结构 和 最 基本 的 操作 。 

3) 为 在 相 容 DBMS 之 间 移 植 数据 库 定 义 和 应 用 程序 模块 而 提供 相应 工具 。 

4) 规定 了 最 低 〈 第 一 级 ) 和 完全 (第 二 级 ) 两 个 标准 ， 人 允许 在 产品 中 采用 不 同 的 等 级 标准 。 

5) 提供 了 一 个 初始 标准 ， 尽 管 它 不 完全 ， 但 以 后 可 以 增强 它 ， 使 之 包括 能 够 处 理 参照 完整 
性 、 事 务 管理 、 用 户 定义 函数 、 等 值 联结 之 外 的 联结 运算 符 以 及 国家 字符 集 (national 
character set) (包含 在 其 他 功能 之 中 ) 的 规格 说 明 。 

SQL-92 标 准 已 被 广泛 接受 ， 大 部 分 新 产品 支持 SQL-92， 且 逐步 支持 核心 SQL-99。 但 是 ， 
各 个 厂商 的 SQL 版 本 都 扩展 了 SQL-92 的 基本 标准 ， 包 含 了 一 些 新 的 增强 功能 、 特 性 和 性 能 。 
例如 ，Oracle 有 一 个 DESCRIBE 命 令 ， 它 能 列 出 表 中 所 有 属性 、 数 据 类 型 和 约束 。 这 个 特性 非 
党 有 用 ,特别 适用 于 那些 正在 熟悉 一 个 演示 数据 库 的 学 生 ， 但 如 果 他 们 使 用 其 他 厂商 的 SQL， 
比如 说 MS-Access， 那 么 通常 找 不 到 这 条 命令 。 因 此 ，SQL 标 准 是 一 个 最 小 功能 集 ， 而 不 是 一 
个 完整 的 功能 集 。SQL 标 准 有 什么 优 缺 点 呢 ? 

这 样 一 个 标准 化 的 关系 语言 的 优点 如 下 : , 

“减少 培训 费用 一 个 企业 可 以 针对 一 门 语言 进行 培训 。 当 雇佣 新 员工 时 ， 由 于 大 批 的 IS 

专业 人 员 已 经 接受 过 这 门 语言 的 培训 ， 这 样 就 减少 了 再 培训 的 需要 。 

。 提 高 生产 能 力 IS 专 业 人 员 通 过 长 期 使 用 可 以 深入 学 习 SQL 并 精通 SQL。 企 业 可 以 投资 购 

洋 新 的 工具 ， 从 而 使 IS 专 业 人 员 的 生产 效率 更 高 。 由 于 程序 员 熟 悉 编 写 程序 所 使 用 的 话 
， 所 以 他 们 能 够 更 加 还 速 地 维护 现 有 程序 。 
“应 用 可 移植 性 ”如 果 每 台 机 器 都 使 用 SQL，、 那 么 应 用 软件 就 能 从 一 台 机 器 移植 到 另 一 台 
机 器 上 。 此 外 ， 对 计算 机 软件 产业 来 说 ， 当 有 一 种 标准 语言 时 ， 开 发 现成 的 应 用 软件 是 
最 经 济 的 。 
“应 用 持久 性 ”标准 语言 往往 能 长 时 间 保 留 ， 因 此 ， 重 写 原 有 应 用 软件 的 压力 会 很 小 。 并 
且 ， 当 标准 语言 增强 或 出 现 DBMS 的 新 版 本 时 ， 应 用 软件 可 以 很 容易 地 进行 更 新 。 
*“ 减少 对 某 个 厂商 的 依赖 性 ”如 果 使 用 一 种 公共 语言 ， 就 可 以 很 容易 地 使 用 不 同 厂商 的 
DBMS、 培 训 和 教育 服务 、 应 用 软件 及 咨询 助理 。 此 外 ， 这 些 厂 商 的 市 场 竞争 会 更 加 激 
烈 ， 这 有 助 于 降低 价格 ， 提 高 服务 质量 。 
“ 跨 条 统 通信 在 管理 数据 和 处 理 用 户 程 序 方面 ， 不 同 DBMS 和 应 用 程序 可 以 更 加 容易 地 
通信 和 协作。 
但 另 一 方面 ， 标 准 可 能 会 抑制 创造 力 和 革新 。 一 种 标准 无 法 满足 所 有 的 需求 ， 而 且 某 种 行 
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业 标 准 是 多 方 折 中 的 结果 ， 它 不 可 能 是 最 理想 的 。 改 变 标准 是 不 太 容 易 的 (因为 许多 厂商 从 中 
获 利 )， 央 此 改变 这 种 固有 的 低 效 性 要 付出 极 大 的 努力 。 标 准 的 另外 一 个 缺点 是 ， 个 别 厂商 在 
SQL 中 增加 某 些 特征 时 ， 可 能 会 导致 丢失 标准 的 一 些 优点 ， 比 如 应 用 的 可 移植 性 。 

最 初 的 SQL 标 准 遭 到 普遍 的 指责 ， 特 别 是 它 缺 乏 参 照 完整 性 规则 和 特定 的 关系 运算 符 。 
Date 和 Darwen (1997) 指出 ，SQL 看 起 来 是 在 不 遵照 已 建立 的 语言 设计 原则 的 情况 下 设计 出 来 
的 ,，“ 结 果 ， 语 言 中 充满 了 无 数 的 约束 ， 特 别 的 结构 ， 烦 人 的 特殊 规则 ”(p.8)。 他 们 认为 标准 
不 够 精确 ， 标 准 SQL 实现 中 的 问题 仍 将 继续 存在 。 在 本 章 中 ， 我 们 可 以 清楚 地 看 到 部 分 缺陷 。 


7.5 SQL 环境 


图 7-1 是 一 个 SQL 环境 的 简化 示意 图 ， 它 与 SQL-92 标 准 是 一 致 的 。 如 图 所 示 ，SQL 环 境 包 括 一 
个 SQL 数据 库 管 理 系统 的 实例 ， 其 中 有 DBMS 访 问 的 数据 库 及 可 以 使 用 该 DBMS 访 问 数 据 库 的 用 
户 和 程序 。 每 个 数据 库 包 含 在 目录 (catalog) 中 ， 目 录 描 述 数据 库 中 的 任何 对 象 ， 而 不 管 是 哪个 
用 户 创造 的 对 象 。 图 7-1 有 两 个 目录 : DEV_C 和 PROD_C。 大 部 分 公司 至 少 保存 他 们 所 使 用 数据 库 
的 两 个 版 本 。 工 作 版 本 (production version， 即 图 中 的 PROD_C) 是 正在 使 用 的 版 本 ， 它 收集 真实 
的 业务 数据 ， 所 以 必须 严密 控制 和 监视 这 个 版 本 。 开 发 版 本 (development version ， 即 图 中 的 
DEV_C) 在 数据 库 构 建 时 使 用 ， 在 应 用 到 工作 数据 库 之 前 ， 它 一 直 作 为 开发 工具 ， 增 强 和 维护 的 
效果 可 以 在 该 版 本 中 进行 彻底 测试 。 通 常 ， 由 于 这 样 的 数据 库 不 包含 真实 的 业务 数据 ， 所 以 该 数 
据 库 没有 被 严密 地 控制 或 监视 。 每 个 数据 库 有 与 目录 相关 的 命名 的 模式 。 模 式 (schema) 是 一 系 
列 相关 的 对 象 集 ， 包 括 (但 不 仅 限于 ) 基 表 和 视图 、 域 、 约 束 、 字 符 集 、 触 发 器 、 角 色 等 等 。 

如 果 多 个 用 户 在 数据 库 中 创建 对 象 , 合并 所 有 用 户 模 式 的 信息 将 会 形成 整个 数据 库 的 信息 。 
每 个 目录 也 必须 包含 一 个 信息 模式 ， 其 中 包含 目录 中 所 有 模式 的 描述 、 表 、 视 图 、 属 性 、 优 先 
权 、 约 束 ， 以 及 域 ， 同 时 还 有 其 他 与 数据 库 相 关 的 信息 。 目 录 中 包含 的 信息 由 DBMS 维 护 ， 它 
是 由 用 户 发 出 的 SQL 命令 的 结果 ， 不 要 求 用 户 采 取 有 意识 地 创建 命令 的 行动 。 句 法 上 简单 的 
SQL 命令 可 引起 由 DBMS 软 件 执行 的 复杂 数据 管理 活动 ， 这 是 SQL 语言 强大 功能 的 一 部 分 。 用 
户 通过 使 用 SQL 的 选择 语句 可 以 浏览 目录 的 内 容 。 


SQL 坏 境 






SQL 查询 


用 户 模 式 | 


图 7-1 SQL-92 标 准 描述 的 一 个 典型 SQL 环 境 的 简化 示意 图 
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SQL 命令 分 为 二 种 类 型 。 第 一 种 类 型 是 数据 定义 语言 (Data Definition Language，DDL ) 
命令 ， 这 些 命令 用 来 创建 、 修 改 和 删除 表 ， 本 章 将 首 | SELECT [ALL DISTINCT column list 
先 对 此 进行 介绍 。 在 工作 数据 库 中 ， 为 了 保护 数据 库 rR tablot 7 oxpression 
结构 不 遭受 意外 修改 ， 通 常 只 能 有 一 个 或 几 个 数据 库 
管理 员 可 以 使 用 DDL 命 令 。 在 开发 过 程 中 或 在 学 生 数 | [RAVING EURbyceoomn ii 
据 库 中 ， 可 以 给 更 多 用 户 授 予 DDL 权 限 。 [ORDER BY order_by_column_list] 

第 一 种 类 型 是 数据 操纵 语言 (Data Manipulation 本 Ei 
Language，DML) 命令 。 许多 人 认为 DML 命 令 是 SQL pr 
的 核心 命令 ， 这 些 命 令 用 来 更 新 、 插 入 、 修 改 和 查询 
数据 库 中 的 数据 。 这 些 命令 可 以 交互 地 使 用 ， 从 而 在 执行 语句 后 ， 就 能 立即 得 到 结果 。 命 令 也 
可 以 包含 在 用 3GL( 如 C、COBOL) 编写 的 程序 中 ， 途 入 式 SQL 命 令 可 以 使 得 程序 员 对 报告 产 
牛 的 时 机 、 界 面 外 观 、 错 误 处 理 和 数据 安全 性 施加 更 多 控制 。 本 章 大 部 分 内 容 以 交互 的 形式 讲 
解 基 本 DML 命 令 。DML 中 使 用 的 SQL SELECT 命令 的 一 般 语法 见 图 7-2。 

最 后 一 种 类 型 是 数据 控制 语言 (Data Control Language，DCL) 命令 。 这 些 命令 有 助 于 
DBA 控 制 数 据 库 。 它 们 包括 这 样 一 些 的 命令 ;授予 和 取消 访问 数据 库 或 数据 库 中 特定 对 象 的 权 
限 ， 存 储 和 删除 对 数据 库 产生 影响 的 事务 。 

每 个 DBMS 有 一 个 它 能 处 理 的 数据 类 型 的 定义 列表 。 所 有 的 DBMS 都 包含 数字 、 字 符 串 和 
日 期 /时 间 变 量 ， 有 些 DBMS 还 包含 图 形 数据 类 型 、 空 间 数据 类 型 和 图 像 数 据 类 型 ， 这 些 数 据 类 
型 极 大 地 增加 了 数据 操纵 的 灵活 性 。 一 旦 创建 了 一 个 表 ， 就 必须 指定 每 个 属性 的 数据 类 型 。 选 
择 某 种 数据 类 型 要 受 需 要 存储 的 数据 值 和 数据 的 预期 使 用 方式 的 影响 。 单 价 应 该 以 数字 格式 存 
储 ， 因 为 通常 会 用 单价 进行 一 些 数 学 操作 ， 例 如 数量 与 单价 的 乘法 操作 。 电 话 号 码 应 该 以 字符 
串 数据 存储 ， 特 别 是 当 这 个 数据 集中 包括 有 外 线 电话 号 码 时 更 应 如 此 。 即 使 电话 号 码 只 包含 数 
字 ， 对 电话 号 码 进行 相 加 或 相 乘 这 一 类 的 数学 操作 也 是 毫 无 意义 的 。 由 于 字符 型 数据 的 处 理 速 
度 快 ， 所 以 如 果 数 字 型 数据 不 需要 进行 数学 计算 ， 也 可 作为 字符 型 数据 存储 。 选 择 日 期 字段 而 
不 是 字符 字段 ， 开 发 人 员 就 可 以 利用 日 期 /时 间 间 隔 计算 功能 ， 而 字符 型 字段 则 没有 此 功能 。 
参见 表 7-1。 

随 着 各 种 图 形 和 图 像 数据 类 型 出 现 ， 在 决定 如 何 存储 数据 时 必须 考虑 业务 需要 。 例 如 ， 颜 
色 (沙滩 色 或 米色 ) 可 作为 一 个 描述 性 字符 字段 存储 起 来 。 但 是 ， 这 种 描述 随 着 厂商 的 不 向 而 
不 同 ， 而 且 它 不 包含 空间 数据 类 型 所 能 包含 的 信息 量 ， 空 间 数据 类 型 可 以 包括 精确 的 红 绿 蓝 亮 
度 值 。 朋 前， 处 理 数据 仓库 的 通用 服务 器 上 都 有 这 些 数 据 类 型 ， RDBMS 上 也 可 出 现 这 些 数据 
类 型 。SQL-92 和 SQL-99 还 支持 一 些 没 有 出 现在 表 7-1 中 的 几 种 数据 类 型 ， 包 括 TIMESTAMP、 
REAL 和 INTERVAL， 其 他 一 些 RDBMS 还 包括 CURRENCY 和 LOGICAL 等 数据 类 型 。 为 了 充分 
利用 RDBMS 的 所 有 功能 ， 你 必须 熟悉 所 用 到 的 每 个 RDBMS 的 可 用 数据 字段 。 


表 7-1 _ Oracle8 数 据 类 型 示例 











字符 串 型 CHAR(n) 定 长 字符 数据 ，n 个 字符 长 度 。 最 大 长 度 为 2000 
VARCHAR2(n) 变 长 字符 数据 。 最 大 长 度 为 4000 字 当 
LONG 变 长 字符 数据 。 最 大 长 度 为 4GB 
每 个 表 最 多 可 有 一 个 
数 空 而 NUMBER(p. gq) 带 符号 十 进 制 数字 、 共 有 P 位 数字 ， 小 数 点 后 有 4 位 
INTEGER(p) 带 符号 整数 ， 十 进 制 或 二 进 制 ， 共 p 位 数字 
FLOATUD) 评点 数 ， 用 科学 计数 法 表 去 ，… 进 制 数 精度 为 p 


日 期 /时 间 型 DATE 定 长 日 期 和 时 间 数 据 ， 采 用 dd-mm-yy 格 式 
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我 们 准备 举例 说 明 SQL 命 令 了 。 我 们 将 使 用 的 例子 数据 见 图 7-3。 表 名 遵循 如 下 命名 规则 : 
在 每 个 表 的 名 字 后 加 下 划 线 和 字母 :， 如 Order_t 或 Product_t。 查 看 这 些 表 时 ， 请 注意 如 下 儿 点 : 

1) 每 份 订 单 必 须 有 一 个 有 效 的 顾客 号 ， 该 顾客 号 包含 在 Order_t 表 中 。 

2) 订单 中 的 每 一 项 既 要 有 一 个 有 效 的 产品 号 ， 又 要 有 Order_Line_t 表 所 示 的 有 效 的 订单 号 。 

3) 这 四 个 表 描绘 了 业务 数据 库 系 统 中 最 常用 关系 集 的 一 个 简化 版 本 , 即 客户 对 产品 的 订购 。 
在 第 3 章 已 经 学 习 了 必要 的 创建 Customer 表 和 Order 表 的 SQL 命令 ， 这 里 将 对 这 些 SQL 命令 进行 
7 





Customer_t 区 概 | 
Contemporary Casuals 1355 S Hines Bivd Gainesville 
2 Value Fumiture 1S145 SW 17th St Plano 
3 Home Furnishings 1900 Allard Ave Aibany 
Eastern Fumiture 1925 Bekiine Rd Carteret 
5 Impressions 5585 Westcott C! Sacramento 
5 Fumture Gallery 325 Flatiron Dr Bouider 
7 Period Furmture 394 Ratnbow Dr Seattle 
8 Calormia Classics 816 Peach Rd Santa Clars 
9 M & H Casual Fumiture 3709 First Sireet Clearwater 
10 Seminoie intenors 2400 Rocky Pomnt Dr Seminole 
11 Amencan Euro Lifestyles 2424 Missoun Ave N. Prospect Park 
12 Battle Cresk F uniture 345 Capitol Ave SW Battie Creek 
13 Hentage F umishings 55789 College Ave 
14 Kaneohe Homes 112 Kiowat St 
15 Mountain Scenes 4132 Main Street 
Order Line_t Ti 
f 
2 
本 
3 
3 
区 
8 
条 
# 
5 
! 
2 
3 
8 
包 
? 
各 
0 
Product.t fry 


1 End Table Cherry 

2 Coffes Table Natural Ash 
3 Computer Desk Natural Ash 

4 Entertainment Center Natural Mapie 


5 Writers Desk Chery 

6 8-Drawer Dresser White Ash 

7 Dining Tabie Natural Ash 

8 Computer Desk Yalnut 
AutoNumber) 





图 7-3 松 谷 家 具 公 司 数据 示例 


本 章 的 剩余 部 分 将 说 明 DDL、DML 和 DCL 命 令 。 图 7-4 概 述 了 在 数据 库 开 发 的 整个 过 程 中 ， 
不 同类 型 的 命令 应 在 什么 地 方 使 用 。 我 们 使 用 下 列 符号 举例 说 明 SQL 命 令 : 

1) 大 写 单词 表示 命令 ， 尽 管 REDBMS 不 要 求 大 写 ,但 将 命令 大 写 有 利于 区 分 。 

2) 小 写 单词 表示 用 户 必须 提供 的 值 。 

3) 括号 里 的 内 容 是 可 选 语法 。 
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4) 省 略 号 〈…) 表示 如 有 必要 可 以 反复 执行 伴随 的 子 句 。 

5) 每 个 SQL 命令 以 分 号 (; ) 结束 。 在 交互 方式 中 ， 当 用 户 按 下 RETURN 键 时 ，SQL 命 令 
就 会 执行 。 小 心 使 用 一 些 其 他 的 习惯 ， 如 键 人 GO,， 或 者 在 命令 中 每 一 行 末 使 用 连续 符号 ， 如 
连 字符 。 为 了 方便 阅读 ， 本 书 采用 间隔 和 缩 排 格 式 ， 这 在 标准 SQL 语 法 中 不 是 必须 的 。 







DDL 
定义 数据 库 : 

创建 大、 索引 、 视 网 
建立 外 键 
删除 或 截断 表 

















DML 
载 入 数据 库 ， 插 入 数据 
更 新 数据 库 

操纵 数据 库 : SELECT 
















DCL 
控制 数据 库 : 
授权 、 增 加 、 取 消 













图 7-4 DDL、DML、DCL 和 数据 库 开发 过 程 


7.6 用 SQL 定 义 数 据 库 


创建 数据 库 时 ， 应 为 大 部 分 系统 分 配 存 储 空间 以 包括 基 表 、 视 图 、 约 束 、 索 引 和 其 他 数据 
库 对 象 。 正 因为 如 此 ， 只 有 数据 库 管 理 员 才 有 权限 创建 数据 库 ， 你 也 可 以 申请 创建 数据 库 。 可 
以 为 大 学 中 的 学 生 分 配 一 个 账号 ， 让 他 们 访问 已 有 数据 库 ， 或 者 允许 他 们 创建 自己 的 数据 库 。 
在任 何 一 种 情况 下 ， 创 建 数据 库 的 基本 语法 是 : 

CREATE SCHEMA database name; 

AUTHORIZATION owner user id; 


虽然 其 他 指定 用 户 也 可 以 使 用 该 数据 库 ， 甚 至 可 以 转移 数据 库 的 所 有 权 ， 但 数据 库 归 授权 
用 户 拥有 。 数 据 库 的 物理 存储 由 硬件 和 软件 环境 决定 ， 通 常 是 系统 管理 员 所 关心 的 方面 。 数 据 
库 管 理 员 能 够 对 物理 存储 施加 的 控制 量 是 由 所 使 用 的 RDBMS 决 定 的 。 当 使 用 MS Access 2000 
时 ,系统 管理 员 几 平 不 能 对 其 进行 控制 ， 而 Oracle 8i 数据 库 管理 员 可 以 对 数据 布局 、 控制 文件 、 
索引 文件 等 方面 施加 较 多 控制 ， 从 而 提高 调节 数据 库 ， 使 其 更 有 效 完成 任务 的 能 力 。 
7.6.1 SQL 数据 库 定 义 

入 门 级 SQL-92 包 括 三 个 SQL DDL CREATE 命 令 : 

"CREATE SCHEMA 用 于 定义 特定 用 户 拥有 的 数据 库 部 分 。 模 式 依赖 于 目录 ， 它 包括 基 

表 、 视 图 、 域 、 约 束 、 断 言 、 字 符 集 、 校 验 等 模式 对 象 。 

"CREATE TABLE 定义 一 个 新 表 和 它 的 列 。 这 个 表 可 以 是 基 表 也 可 以 是 导出 表 。 表 依赖 





240 课 四 部 分 实 现 


于 模式 。 导 出 表 是 通过 执行 用 到 一 个 或 多 个 表 或 视图 的 查询 而 创建 的 。 

“CREATE VIEW 从 一 个 或 多 个 表 或 视图 定义 一 个 逻辑 表 。 视 图 无 法 被 索引 。 通 过 视图 更 

新 数据 有 一 定 的 限制 。 在 视图 可 以 被 更 新 的 地 方 ， 产生 的 变化 会 影响 到 底层 的 基 表 一 一 

这 些 基 表 最 初 用 来 创建 视图 。 

上 向 介绍 的 每 个 CREATE 命 令 都 可 以 通过 DROP 命 令 来 撤销 。 因 此 ，DROP TABLE 将 会 删 
除 一 张 表 ， 包 括 与 之 相关 的 定义 、 内 容 、 任 何 约 束 、 视 图 和 索引 。 通 常 只 有 表 的 创建 者 可 以 删 
除 表 。DROP SCHEMA 和 DROP VIEW 也 可 以 删除 命名 的 模式 和 视图 。ALTER TABLE 可 以 改 
变 一 个 现 有 基 表 的 定义 ， 它 通过 增加 、 删 除 、 改 变 列 或 者 删除 约束 来 改变 基 表 的 定义 。 

SQL-92 标 准 还 有 其 他 万 个 CREATE 命 令 。 它 们 都 不 要 求 满 足 SQL-92 的 入 门 级 或 中 间 级 标准 。 

*CREATE CHARACTER SET 允许 用 户 为 文本 字符 串 定义 字符 集 ， 因 为 可 以 使 用 非 英 

语 语言 ， 有 助 于 SQL 的 全 球 化 。 每 个 字符 集 包 含 一 组 字符 、 内 部 表示 每 个 字符 的 方法 、 

这 种 表示 的 数据 格式 以 及 校 验 或 对 字符 集 分 类 的 方法 。 

“CREATE COLLATION “一 个 命名 的 模式 对 象 ， 它 指定 了 字符 集 呈 现 的 顺序 。 通 过 操纵 

现 有 的 校 验 可 以 创建 新 的 校 验 。 

“CREATE TRANSLATION “一 个 命名 规则 集 ， 为 了 进行 变换 或 转换 ， 它 将 字符 从 源 字符 

集 映射 到 目标 字符 集 。 

“CREATE ASSERTION 一 个 模式 对 象 ， 它 建立 CHECK 约 束 ， 当 该 约束 为 假 时 是 非法 的 。 

“CREATE DOMAIN 一 个 建立 了 域 的 模式 对 象 ， 或 属性 上 的 有 效 值 集 。 数 据 类 型 可 以 指 

定 ， 如 果 需 要 的 话 ， 也 可 以 指定 一 个 默认 值 、 校 验 或 其 他 约束 。 : 

7.6.2 创建 表 

一 旦 设计 好 数据 模型 并 进行 规范 化 后 ， 就 可 以 使 用 SQL CREATE TABLE 命 令 定义 各 表 中 
所 需 的 列 。CREATE TABLE 的 语法 如 图 7-5 所 未 。 以 下 是 创建 表 时 要 遵循 的 一 系列 步骤 。 

1) 为 每 个 属性 确定 合适 的 数据 类 型 ， 包 括 长 度 、 精 度 和 刻度 (如 有 必要 )。 

2) 指定 列 能 否 接受 空 值 ， 这 在 第 6 章 中 讨论 过 。 当 创建 表 时 ， 同 时 也 创建 了 列 不 能 为 空 值 
的 列 控制 ， 在 输入 数据 时 ， 对 表 的 每 次 更 新 都 会 强制 执行 列 控制 。 

3) 确定 必须 惟一 的 列 。 当 为 某 个 列 建立 了 UNIQUE 的 列 控制 时 ， 对 于 表 中 每 一 行 数据 ， 此 
列 的 数据 必 为 不 同 的 值 ( 也 就 是 说 ,没有 重复 的 值 )。 如 果 一 列 或 多 列 指定 为 UNIQUE， 那 么 
该 列 或 多 列 就 是 一 个 候选 键 (在 第 5 章 讨论 过 )。 尽 管 每 个 基 表 可 以 有 多 个 候选 键 ， 但 只 能 有 一 
个 候选 键 可 以 指定 为 PRIMARY KEY。 当 某 列 被 指定 为 PRIMARY KEY 时 ， 即 使 没有 明确 说 明 
该 列 为 NOT NULL， 系 统 也 会 认为 它 是 NOT NULL，UNIQUE 和 PRIMARY KEY 均 为 列 约束 。 

4) 确定 所 有 的 主键 -外 键 对 (第 5 章 讨论 过 )。 在 创建 表 时 可 立即 建立 外 键 ， 或 在 以 后 通过 
修改 表 来 建立 外 键 。 对 于 有 父子 关系 的 表 ， 首 先 应 创建 父 表 ， 这 样 在 创建 子 表 时 ， 它 能 引用 已 
存在 的 父 表 。 列 约束 REFERENCES 可 用 来 执行 参照 完整 性 。 

5) 确定 要 插入 到 所 有 列 中 的 值 ， 可 以 为 各 列 指定 默认 值 。 在 SQL-92 中 ，DEFALUT 可 以 用 
于 定义 默认 值 ， 在 输入 数据 时 ， 若 没有 数据 和 输入， 就 将 默认 值 自动 地 插入 表 中 。 在 图 7-6 中 ， 创 
建 ORDER_T 表 的 命令 已 为 DATE 属 性 定义 了 SYSDATE 的 默认 值 (Oracle 中 当前 日 期 的 名 称 )。 

6) 确定 所 有 这 样 的 列 ， 在 其 上 可 以 声明 域 规格 说 明 ， 使 得 这 些 列 上 的 约束 比 由 数据 类 型 所 
建立 的 列 上 的 约束 更 多 。 在 SQL-92 中 使 用 CHECK 作 为 列 约束 ， 对 于 要 插入 到 数据 库 中 的 值 ， 
可 以 为 其 建立 有 效 性 规则 。 在 图 7-6 中 ， 创建 PRODUCT_T 表 时 包括 一 个 CHECK 约 束 ， 它 列举 
了 PRODUCT_FINISH 的 各 种 可 能 值 。 因 此 ， 即 使 “White Maple” 项 满足 变 长 字符 数据 类 型 约 
束 ， 但 由 于 “White Maple” 不 在 检查 列表 中 依然 会 遭 到 拒绝 。 
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7) 使 用 CREATE TABLE 和 CREATE INDEX 语 句 创建 表 和 所 有 需要 的 索引 (索引 是 用 来 提 


高 查询 性 能 的 ， 所 以 CREATE INDEX 命 令 不 是 
SQL-92 标 准 的 一 部 分 ， 但 大 多 数 RDBMS 都 使 
用 它 )。 

在 第 3 章 和 第 5 章 中 ， 我 们 展示 了 为 松 谷 家 
具 公 司 创 建 Customer 表 和 Order 表 的 SQL 数据 库 
定义 命令 ， 在 CREATE TABLE 命 令 中 包含 了 列 
约束 。 在 图 7-6 中 ， 我 们 展示 了 使 用 Oracle 8i 的 
数据 库 定义 命令 ， 它 包括 了 其 他 的 列 约束 ， 并 
旦 为 主键 和 外 键 命名 。 例 如 ，Customer 表 的 主 
键 是 CUSTOMER_ID ， 主 键 约束 命名 为 
CUSTOMER_PK。 现 以 Oracle 为 例 ， 当 查看 
DBA_CONSTRAINTS 表 时 ， 数 据 库 管理 员 可 以 
很 容易 确定 Customer 表 中 的 主键 约束 ， 因 为 它 








CREATE TABLE tablename 
( {column definiton [table constraint] }.,.. 
[ON COMMIT {DELETE | PRESERVE} ROWS] ); 







where column definition ::= 
column_name 

{domain name | datatype [(size)] } 
[column_constraint_clause...] 
[default value] 
[collate clause] 















and tiable constraint ::= 
[CONSTRAINT constraint_namel] 
Constraint_type {constraint_attributes] 








图 7-5 数据 定义 语言 中 CREATE TABLE 
语句 的 一 般 语法 


的 名 字 CUSTOMER_PK 是 Costraint_Name 列 的 值 。 如 果 没有 约束 名 ， 就 会 自动 分 配 一 个 系统 标 


识 符 ， 该 标识 符 很 难 去 阅读 。 








CREATE TABLE CUSTOMER_T 


(CUSTOMER_ID NUMBER(11, 0) NOT NULL, 


CUSTOMER_NAME VARCHAR2(25) NOT NULL， 
CUSTOMER_ADDRESS VARCHAR2(30), 

CITY VARCHAR2{20), 

STATE VARCHAR2(2), 
POSTAL_CODE VARCHAR2(9), 


CREATE TABLE ORDER_T 


CONSTRAINT ORDER_PK PRIMARY KEY (ORDER_ID), 


CREATE TABLE PRODUCT T 


CREATE TABLE ORDER_LINE_T 


CONSTRAINT CUSTOMER_PK PRIMARY KEY (CUSTOMER_ID)); 


(ORDER_ID NUMBER(11, 0) NOT NULL， 
ORDER_DATE DATE DEFAULT SYSDATE， 
CUSTOMER_ID NUMBERI(1T1, 0), 


CONSTRAINT ORDER_FK FOREIGN KEY (CUSTOMER_ID) REFERENCES CUSTOMER _T(CUSTOMER_{D)); 


(PRODUCT_ID INTEGER NOT NULL, 
PRODUCT_DESCRIPTION VARCHAR2(50), 
PRODUCT_FINISH VARCHAR2(20) 


CHECK (PRODUCT_FINISH IN (‘Cherry', 'Natural Ash', 'White Ash’, 
‘Red Oak’, ‘Natural Oak’, ‘Wainut’)), 
STANDARD_PRICE DECIMAL(6,2), 
PRODUCT_LINE_ID INTEGER, 
CONSTRAINT PRODUCT_PK PRIMARY KEY (PRODUCT_ID)); 


(ORDER_fD NUMBER(11,0) NOT NULL, 
PRODUCT_ID NUMBER(11,0) NOT NULL， 
ORDERED_QUANTITY NUMBER(11,0)， 


CONSTRAINT ORDER_LINE_PK PRIMARY KEY (ORDER_ID, PRODUCT ID)， 
CONSTRAINT ORDER_LINE_FK1 FOREIGN KEY(ORDER_ID) REFERENCES ORDER_T(ORDER _ID)， 
CONSTRAINT ORDER_LINE_FK2 FOREIGN KEY (PRODUCT _ID) REFERENCES PRODUCT_T(PRODUCT_ID)); 


























图 7-6 松 谷 家 具 公司 的 SQL 数据 库 定义 命令 (Oracle 8i) 


7.6.3 使 用 和 定义 视图 


图 7-6 中 所 显示 的 SQL 语法 ， 说 明了 在 一 个 数据 库 模式 中 如 何 创建 四 张 基 表 (base table )。 





242 ” 芒 四 部 分 和 再 








这 些 表 用 于 数据 库 中 数据 的 物理 存储 ， 对 应 于 概念 模式 中 的 实体 。 使 用 SQL 查 询 ， 可 以 创建 虚 
拟 表 ， 即 动态 视图 (dynamic view )， 当 引用 它们 时 ， 它 们 的 内 容 就 被 物化 。 这 些 视图 可 以 经 
常 利 用 SQL SELECT 查询 ， 用 与 处 理 基 表 相 同 的 方式 加 以 处 理 。 也 可 以 使 用 物化 视图 
(materialized view)， 它 存储 在 物理 磁盘 上 ， 在 适当 间隔 内 或 事件 发 生 时 刷新 。 
视图 的 作用 是 简化 查询 命令 ， 但 它 也 能 够 为 数据 库 提 供 有 效 的 数据 安全 保护 ， 显 著 地 提高 
程序 的 生产 率 。 为 了 着 重 说 明 视 图 的 方便 之 处 ， 考 察 图 1-6 中 的 松 谷 家 具 公 司 发 货 单 。 构 造 发 
货 单 需要 访问 图 7-3 中 松 谷 家 具 公 司 数 据 库 的 四 张 表 : CUSTOMER_T、ORDER_T、ORDER_ 
LINE_T 和 PRODUCT_T。 一 个 数据 库 的 新 手 在 构造 这 样 的 多 表 查 询 时 ， 也 许 会 出 错 ， 也 许 效 
率 会 很 低 。 视 图 可 以 使 我 们 预先 将 这 种 联系 定义 到 单个 虚拟 表 中 ， 它 是 数据 库 的 一 部 分 。 有 了 
这 个 视图 ， 只 需要 顾客 发 货 单 数据 的 用 户 就 不 必 重 建 表 之 间 的 联系 来 产生 报表 或 报表 的 任何 子 
集 。 表 7-2 总 结 了 使 用 视图 的 优 缺 点 。 
视图 INVOICE_V 通 过 指定 的 一 条 SQL 查询 (SELECT-FROM-WHERE) 来 定义 ， 查 询 的 结 
果 就 产生 了 视图 。 
查询 1 为 一 个 客户 创建 一 张 发 货 单 需要 哪些 数据 元 素 ? 以 INVOICE_V 为 名 将 此 查询 保存 
为 视图 。 
CREATE VIEW INVOICE V AS 
SELECT CUSTOMER T.CUSTOMER ID,CUSTOMER ADDRESS, 
ORDER_T.ORDER ID,PRODUCT T.PRODUCT ID,ORDERED QUANTITY, 
/* 和 其 他 要 求 的 列 */ 
FROM CUSTOMER T, ORDER _T， ORDER_LINE_T， PRODUCT T 
WHERE CUSTOMER_ T.CUSTOMER ID= ORDER_T. CUSTOMER ID 
AND ORDER T.ORDER ID= ORDER LINE T. ORDER_ID 
AND PRODUCT T.PRODUCT ID= ORDER LINE T. PRODUCT _ID; 


表 7-2 使 用 动态 视图 的 优 缺 点 


优点 缺 ”点 

简化 查询 命令 每 次 当 视 图 被 引用 时 ， 重 新 创建 视图 会 占用 处 理 时 间 

有 助 于 提高 数据 安全 性 和 机 密 性 不 一 定 能 直接 更 新 

提高 程序 只 的 生产 率 

包含 大 多 数 当 前 基 表 的 数据 

占用 很 少 的 存储 空间 

为 用 户 提供 定制 的 视图 

建立 了 数据 的 物理 独立 性 
一 一 一 -一 -一 

SELECT 子 句 指定 〈 或 投影 ) 视图 表 中 包含 的 数据 元 素 ( 列 )，FROM 子 句 显示 了 构建 视图 
时 需要 的 表 和 视图 ，WHERE 子 句 指定 用 来 联结 CUSTOMER_T、ORDER_T、ORDER_LINE T 
和 PRODUCT_T 时 的 公共 列 名 。 由 于 视图 是 一 张 表 ， 表 中 有 这 样 一 条 关系 的 性 质 ， 即 行 的 顺序 
并 不 重要 ， 所 以 视图 中 的 行 可 以 不 经 过 排序 。 然 而 ， 引 用 视图 的 查询 可 按 任何 指定 的 顺序 显示 
结果 。 

通过 建立 一 个 订单 号 为 1004 订 货 单 的 查询 ， 我 们 可 以 看 到 视图 的 强大 功能 。 不 必 指 定 四 个 
表 的 联结 ， 查 询 能 从 视图 INVOICE_V 中 找到 所 有 相关 数据 元 素 。 

查询 2 创建 订单 号 为 1004 订 货 单 需要 哪些 必要 的 数据 ? 

SELECT CUSTOMER_ ID,CUSTOMER ADDRESS,PRODUCT ID,QUANTITY(... 其 他 需要 的 列 ) 

FROM INVOICE_V 
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WHERE ORDER ID=1004; 


动态 视图 是 一 张 虚拟 的 表 ， 必 要 时 可 由 DBMS 自 动 创建 ， 而 且 不 必 像 维护 真实 数据 那样 维 
护 它 。 任 何 SQL SELECT 语句 都 可 以 用 来 创建 视图 。 真 实数 据 存储 在 基 表 中 ， 这 些 表 已 由 
CREATE TABLE 命 令 定义 。 动 态 视图 总 是 包含 最 近 导 出 的 数据 值 ， 所 以 就 最 新 数据 来 说 ， 动 
态 视图 优 于 通过 几 个 基 表 临时 建立 起 来 的 真实 表 。 而 且 与 临时 的 真实 表 相 比 ， 视 图 只 占用 极 小 
的 存储 空间 。 然 而 ， 每 次 访问 视图 内 容 时 ， 都 必须 计算 这 些 内 容 ， 因 而 视图 的 代价 很 大 。 现 在 
可 以 使 用 物化 视图 来 解决 这 方面 的 不 足 。 

视图 可 以 把 多 个 表 或 视图 联结 起 来 ， 同 时 可 以 包含 导出 (或 虚拟 ) 列 。 例 如 ， 如 果 松 谷 家 
有 具 公司 数据 库 的 一 个 用 户 只 想 知道 每 件 家 有 具 产品 所 有 订单 的 总 值 ， 那 么 可 以 在 Oracle SQL*Plus 
中 利用 INVOICE_V 创 建 这 个 视图 。 

查询 3 每 件 家 具 产 品 所 有 订单 的 总 值 是 多 少 ? 

CREATE VIEW ORDER_TOTALS V RS 

SELECT PRODUCT ID PRODUCT,SUM(UNIT PRICE*QUANTITY) TOTAL 


FROM INVOICE V 
GROUP BY PRODUCT ID; 


我 们 可 为 视图 中 的 列 指定 与 基 表 或 表达 式 中 的 列 不 同 的 名 字 (别名 )。 在 本 例 中 ， 
PRODUCT_ID 重 命名 为 PRODUCT， 该 别名 仅 局 限 此 视图 。TOTAL 是 各 产品 销售 总 值 表 达 式 
的 列 名 。 有 了 这 个 视图 后 ， 随 后 的 查询 就 能 把 该 表达 式 当 作 列 一 样 引 用 ， 而 不 是 把 它 当成 一 个 
导出 的 表达 式 引 用 。 基 于 其 他 视图 来 定义 视图 可 能 会 产生 一 些 问 题 。 例 如 ， 如 果 我 们 重新 定义 
INVOICE_V， 其 中 不 包括 UNIT_PRICE， 那 么 由 于 ORDER_TOTAL_V 找 不 到 单价 ， 它 将 不 再 
有 效 。 

视图 有 助 于 保证 安全 性 。 用 户 看 不 到 视图 中 没有 包括 的 表 和 列 。 同 时 ， 利 用 GRANT 和 
REVOKE 语 句 限制 对 视图 访问 ， 又 增加 了 一 层 安 全 性 。 例 如 ， 可 以 授权 一 些 用 户 访问 视图 中 的 
聚合 数据 ， 如 平均 数 ， 而 不 允许 他 们 访问 基 表 和 详细 数据 ， 这 样 就 使 得 他 们 无 法 看 到 基 表 中 的 
数据 。 第 12 章 将 进一步 解释 SQL 安全 命令 。 

通过 创建 视图 ， 限 制 用 户 只 能 使 用 他 完成 任务 所 必须 的 数据 ， 就 能 够 实现 数据 的 私有 性 和 
机 密 性 。 如 果 一 个 文员 需要 知道 某 个 员工 的 地 址 ， 但 又 不 能 让 他 知道 员工 的 赔偿 率 ， 可 以 让 办 
事 册 访问 一 个 不 包含 赔偿 信息 的 视图 。 , 

有 些 人 提倡 为 每 个 基 表 建立 视图 ， 即 使 视图 与 基 表 完全 相同 也 是 如 此 。 他 们 之 所 以 这 样 建 
议 ， 是 因为 随 着 数据 库 的 演化 ， 视 图 有 利于 提高 编程 效率 。 考 虑 这 样 一 种 情况 ， 有 50 个 程序 都 
使 用 CUSTOMER_T 表 。 假 设 进一步 补充 松 谷 家 具 公司 的 数据 库 以 支持 新 功能 ， 要 求 将 
CUSTOMER_T 表 重新 规范 化 为 两 张 表 。 如 果 这 50 个 程序 都 使 用 这 张 基 表 上 的 视图 ， 那 么 只 需 
重新 创建 这 个 视图 ， 这 样 节约 了 大 量 的 重新 编程 的 工作 。 然 而 ， 由 于 每 次 引用 视图 时 ， 都 要 重 
新 创建 该 视图 的 虚拟 表 ， 所 以 动态 视图 需要 大 量 的 运行 时 计算 机 处 理 。 因 此 与 直接 引用 基 表 相 
比 ， 通 过 视图 引用 基 表 增加 了 大 量 的 查询 处 理 时 间 。 必 须 在 这 种 额外 操作 成 本 与 利用 视图 避免 
的 法 在 重新 编程 之 间 进 行 平衡 。 

在 本 章 后 面部 分 ， 我们 将 创建 和 使 用 动态 视图 ， 动 态 视图 复制 了 松 谷 家 具 公 司 的 表 ， 用 来 
举例 说 明 SQL 语 法 。 下 列 SQL 语 句 建立 了 基 表 的 视图 : 

CREATE VIEW CUSTOMER V AS SELECT * FROM CUSTOMER 7T; 

CREATE VIEW ORDER V AS SELECT * FROM ORDER T; 


CREATE VIEW ORDER LINE V AS SELECT * FROM ORDER _ LINE TT; 
CREATE VIEW PRODUCT V AS SELECT * FROM PRODUCT T; 
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在 一 定 的 限制 下 ， 可 以 直接 从 视图 而 不 从 基 表 中 更 新 数据 是 可 能 的 。 一 般 说 来 ， 就 基 表 的 
数据 修改 来 说 ， 只 要 更 新 操作 是 明确 的 ， 就 允许 在 视图 中 对 数据 进行 更 新 。 但 如 果 CREATE 
VIJEW 语 句 包 含 下 列 任 何 情况 ， 视 图 将 不 能 直接 更 新 。 

1) SELECT 子 句 包括 关键 字 DISTINCT ( 本章 后 面 7.9 节 中 将 详细 讨论 SELECT 子 句 )。 

2) SELECT 子 句 包含 导出 列 、 聚 合 、 统 计 国 数 等 的 表达 式 。 

3) FROM 子 句 、 子 查询 或 者 UNION 子 名 引用 多 个 表 。 

4) FROM 子 句 、 子 查询 引用 一 个 不 能 更 新 的 其 他 视图 。 

5) CREATE VIEW 命令 包含 GROUP BY 或 者 HAVING 子 句 。 

可 能 会 发 生 这 样 情况 ， 对 一 个 实例 更 新 将 导致 这 个 实例 从 视图 中 消失 。 我 们 创建 一 个 名 为 
EXPENSIVE_STUFF_V 视 图 ， 视 图 显示 了 所 有 UNIT_PRICE 超 过 $300 的 家 具 产 品 。 该 视图 包含 
一 张 PRODUCT_ID 是 5 的 写字 台 ， 单 价 为 $325。 如 果 我 们 通过 EXPENSIVE_STUFF_V 更 新 数 
据 ， 把 写字 台 的 单价 减 至 $295， 那 么 由 于 写字 台 的 单价 现在 低 于 $300 ， 所 以 它 不 再 在 
EXPENSIVE_STUFF_V 虚 拟 表 中 出 现 。 如 果 需 要 跟踪 原来 价格 超过 $300 的 所 有 商品 ， 就 在 
CREATE VIEW 命令 的 SELECT 子 句 后 增加 WITH CHECK OPTION 子 句 。 如 果 UPDATE 和 
INSERT 语 名 使 更 新 或 插入 的 行 从 视图 中 删除 ， 那 么 WITH CHECK OPTION 子 句 将 拒绝 这 样 的 
语句 。 这 个 选项 仅 用 于 能 更 新 的 视图 。 

下 面 是 用 于 创建 EXPENSIVE_STUFF_V 的 CREATE VIEW 语句 。 

查询 4 显示 所 有 UNIT_PRICE 曾 经 超过 $300 的 家 具 产 品 。 

CREATE VIEW EXPENSIVE STUFF V 

AS 
SELECT PRODUCT _ID,PRODUCT NAME,UNIT PRICE 
FROM PRODUCT T 
WHERE UNIT PRICE>300 
WITH CHECK OPTION; 
当 试 图 将 写字 台 的 单价 更 新 为 $295 时 ， 可 以 使 用 如 下 Oracie SQL*Pius 语 法 : 
UPDATE EXPENSIVE STUFF V 
SET UNIT PRICE=295 
WHERE PRODUCT ID=5; 

Oracle 将 显示 出 错 信 息 ; 

ERROR at line 1: 

ORA-01402:; View WITH CHECK OPTION where-clause violation 


写字 台 价 格 提 高 到 $350 将 会 有 效 ， 而 不 会 出 现 出 错 信 息 ， 这 是 因为 视图 是 可 更 新 的 ， 并 且 
没有 违背 视图 中 指定 的 条 件 。 

视图 信息 存储 在 DBMS 的 系统 表 中 。 例 如 ， 在 Oracle8 中 ， 所 有 视图 的 文本 存储 在 
DBA_VIEWS 中 ， 拥 有 系统 权限 的 用 户 能 找到 这 条 信息 。 

查询 5 EXPENSIVE_STUFF 视 图 有 名 些 可 用 的 信息 ? 

SELECT * FROM DBA VIEWS WHERE VIEW NAME='EXPENSIVE STUFF V'; 





结果 : 
OWNER VIEW NAME TEXT LENGTH TEXT 
MPRESCOTT EXPENSIVE STUFF V 103 


SELECT PRODUCT _ID, PRODUCT NAME, UNIT PRICE 
FROM PRODUCT T 
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WHERE UNIT PRICE>300 


物化 视图 像 动态 视图 一 样 ， 可 以 用 不 同方 式 建立 物化 视图 以 满足 不 同 的 要 求 。 表 可 以 整 
体 或 部 分 地 被 复制 ， 可 以 在 预定 的 时 间 间 隔 被 刷新 ， 或 者 在 需要 访问 表 时 被 触发 。 物 化 视图 建 
立 在 对 一 个 或 多 个 表 查 询 的 基础 之 上 。 在 Oracle8i 中 ， 可 以 创建 基于 数据 聚合 的 概要 表 。 使 用 
分 布 式 数据 的 远程 数据 拷贝 可 以 以 物化 视图 的 形式 在 本 地 存储 。 保 持 本 地 视图 与 远程 基 表 或 数 
据 仓 库 同步 将 会 带 来 维护 开销 ， 但 使 用 物化 视图 可 以 提高 分 布 式 查 询 的 性 能 ， 特 别 是 当 物 化 视 
图 中 数据 相对 来 说 是 静态 的 ， 不 需要 经 常 被 刷新 。 

7.6.4 创建 数据 完整 性 控制 

在 图 7-6 中 ， 我 们 已 经 看 到 创建 外 键 的 语法 。 为 了 在 关系 数据 模型 中 关系 是 !: M 的 两 个 表 
之 间 建 立 参照 完整 性 ， 关 系 中 “1” 端 的 表 的 主键 可 以 被 “M” 端 的 表 的 一 列 引 用 。 参 照 完 整 
性 意味 着 “M” 端的 匹配 列 中 的 革 个 值 必 须 对 应 于 “1 端的 考 中 某 个 和 的 主键 值 ， 或 者 为 
NULL。 如 果 外 键 的 值 在 它 所 引用 的 主键 列 中 不 是 一 个 已 存在 的 有 效 值 ，SQL REFERENCES 
子 句 将 不 允许 增加 这 样 一 个 值 。 尽 管 存 在 这 一 条 限制 ， 但 还 是 存在 其 他 完整 性 问题 。 

如 果 CUSTOMER._ID 的 值 改变 ， 那 么 该 顾客 与 该 顾客 所 下 订单 之 间 的 联系 就 会 被 破坏 。 
REFERENCES 子 句 可 以 防止 对 外 键 的 值 做 这 样 的 改变 ， 但 没 法 防止 对 主键 的 值 做 这 样 的 改变 。 
该 问题 可 以 通过 这 样 声明 来 解决 :一 旦 创建 了 主键 的 值 ， 就 不 能 再 改变 它 。 在 这 种 情形 下 ， 在 
大 多 数 系统 中 ， 通 过 包含 ON UPDATE RESTRICT 子 句 ， 就 可 以 处 理 对 Customer 表 的 更 新 。 这 
样 ， 试 图 删除 或 改变 主键 值 的 任何 更 新 都 被 拒绝 ， 除 非 在 任何 子 表 中 都 不 存在 外 键 引用 该 值 。 
图 7-7 中 列 出 了 与 更 新 相关 的 语法 。 


CUSTOMER A ORDER 
(PK=CUSTOMER_ID) NN (FK=CUSTOMER_ID) 


受 限 更 新 : 表 CUSTOMER 中 的 顾客 [ID 只 有 在 表 ORDER 中 不 存在 时 才 可 以 被 出 除 


CREATE TABLE CUSTOMER_T 


(CUSTOMER_ID INTEGER DEFAULT ‘C999’ NOT NULL， 
CUSTOMER_NAME VARCHAR(40) NOT NULL， 


CONSTRAINT CUSTOMER_ PK PRIMARY KEY (CUSTOMER_ ID), 
ON UPDATE RESTRICT); 


级 联 更 新 : 当 表 CUSTOMER 中 的 顾客 ID 改 变 时 ， 表 ORDER 中 的 对 应 ID 也 会 发 生 相应 改变 
... ON UPDATE CASCADE); 
空 值 更 新 : 当 表 CUSTOMER 中 的 顾客 ID 改 变 时 ， 表 ORDER 中 对 应 的 原 ID 都 设 为 空 什 


.. ON UPDATE SET NULU; 


默认 值 更 新 : % 表 CUSTOMER 中 的 顾客 ID 改 变 时 、 表 ORDER 中 对 应 的 原 ID 都 设 为 预先 定义 的 - 
个 默认 值 


.ON UPDATE SET DEFAULT); 


图 7-7 在 更 新 时 保证 数据 完整 性 
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另 一 种 解决 方法 是 通过 使 用 ON UPDATE CASCADE 选 项 ， 把 这 种 改变 传递 到 子 表 。 如 果 
一 个 顾客 ID 号 改变 ， 这 种 改变 将 级 联 地 传递 到 子 表 ORDER_T， 并 且 ORDER_T 表 中 的 顾客 ID 
也 将 更 新 。 

第 三 种 解决 方法 是 允许 更 新 CUSTOMER_T， 但 要 使 用 ON UPDATE SET NULL 选 项 ， 将 
ORDER_T 表 中 相关 的 CUSTOMER_ID 值 置 为 NULL。 在 这 种 情形 下 ， 使 用 SET NULL 选 项 将 导 
致 订单 和 顾客 之 间 的 联系 丢失 ， 这 不 是 我 们 需要 的 结果 。 在 这 几 种 方法 中 ，CASCADE 是 使 用 
最 灵活 的 选项 。 如 果 要 删除 一 条 顾客 记录 ， 可 以 使 用 ON DELETE RESTRICT、CASCADE 或 
者 SET NULL。 使 用 DELETE RESTRICT， 如 果 在 ORDER_T 表 中 有 顾客 的 订单 ， 那 么 不 能 删除 
这 条 顾客 记录 ; 使 用 DELETE CASCADE， 如 果 删 除 一 个 顾客 ， 将 会 删除 ORDRE_T 中 与 这 个 
顾客 相关 的 所 有 订单 记录 ; 使 用 DELETE SET NULL， 在 某 条 顾客 记录 删除 之 前 ， 该 顾客 的 订 
单 记 录 就 会 置 为 空 值 ; 使 用 DELETE SET DEFAULT 时 ， 在 某 条 顾客 记录 删除 之 前 ， 这 个 顾客 
的 订单 记录 就 会 置 为 一 个 默认 值 。DELETE RESTRICT 可 能 用 得 最 为 普遍 。 不 是 所 有 的 SQL 
RDBMS 都 提供 主键 的 参照 完整 性 ， 在 这 种 情况 下 ， 对 主键 列 的 更 新 和 删除 就 不 能 撤销 。 

7.6.5 修改 表 的 定义 

可 以 通过 修改 列 的 规格 说 明 来 修改 表 的 定义 。 使 用 ALTER TABLE 命 令 ， 可 以 在 一 张 已 经 
存在 的 表 中 增加 新 的 列 。 例 如 ， 在 CUSTOMER 表 中 增加 一 个 顾客 类 型 的 列 。 

命令 在 CUSTOMER 表 增加 一 个 顾客 类 型 列 。 


ALTER TABLE CUSTOMER 了 
RDD (TYPE VARCHAR(2)); 


ALTER TABLE 命 令 可 以 包括 像 ADD、DROP 和 ALTER 之 类 的 关键 字 ， 允 许 修改 列 名 、 数 
据 类 型 、 长 度 和 约束 。 通 常 来 说 ， 当 增加 新 列 时 ， 为 了 便于 处 理 表 中 已 有 的 数据 ， 它 的 状态 置 
为 NULL。 当 创建 新 的 列 时 ， 表 中 所 有 的 实例 都 增加 这 一 列 ， 且 将 它 的 值 置 为 NULL 是 最 合理 
的 。 由 于 在 使 用 数据 库 过 程 中 常常 出 现 需求 改变 、 使 用 原型 、 开 发 方法 改进 、 出 现 错误 等 情况 ， 
所 以 为 使 数据 库 适 应 这 些 不 可 避免 的 修改 ，ALTER 命 令 的 引入 意义 重大 。ALTER 命 令 不 能 用 
来 修改 视图 。 
7.6.6 删除 表 

表 的 所 有 者 可 以 使 用 DROP TABLE 命 令 从 数据 库 中 删除 表 ， 通 过 使 用 类 似 的 DROP VIEW 
命令 可 以 删除 视图 。 

命令 ”从 数据 库 模式 中 删除 一 张 表 。 


DROP TABLE CUSTOMER T; 


该 命令 将 会 删除 表 ， 并 且 把 即将 发 生 的 任何 变化 保存 到 数据 库 中 。 某 人 要 想 删除 一 张 表 ， 
他 必须 拥有 这 张 表 ， 或 者 被 授予 DROP TABLE 系 统 权限 。 删 除 表 将 会 导致 删除 相关 索引 和 所 授 
予 的 相关 权限 。DROP TABLE 命 令 可 以 用 关键 字 RESTRICT 或 CASCADE 限 定 。 如 果 指 定 了 
RESTRICT， 那 么 当 存在 任何 当前 引用 了 这 张 表 的 依赖 对 象 (如 视图 、 约 束 ) 时 ， 该 命令 会 
败 ， 不 能 删除 这 张 表 。 当 指定 CASCADE 时 ， 如 果 删 除 这 张 表 ， 则 该 表 的 所 有 依赖 对 象 都 将 被 
删除 。 在 Oracle 中 ， 可 以 利用 TRUNCATE TABLE 命 令 删 除 向 表 中 输入 的 所 有 数据 ， 但 保留 表 
的 结构 。 


7.7 插入 、 更 新 和 删除 数据 
一 旦 创建 了 表 和 视图 ， 在 编写 查询 语句 之 前 ， 必 须要 向 表 和 视图 中 输入 数据 并 维护 这 些 数 
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据 。 用 于 填充 表 的 SQL 命令 是 INSERT。 如 果 为 表 中 的 每 一 列 输入 一 个 值 ， 可 以 使 用 下 列 命令 ， 
它 用 来 给 CUSTOMER_T 表 增加 第 一 行 数据 。 注意， 数据 值 的 顺序 必须 与 表 中 列 的 顺序 一 致 。 
命令 在 表 中 插入 一 行 数据 时 ， 为 每 个 属性 插入 一 个 值 。 
INSERT INTO CUSTOMER T VALUES 
(001, 'Contemporary Casuals', '1355 S.Himes Blvd.', 'Gainesville', 'FL', 32601); 


当 数 据 并 没有 输入 到 表 中 的 每 一 列 时 ， 可 以 将 空 字段 置 为 NULL， 要 么 指定 要 增加 数据 的 
列 。 在 INSERT 命 令 中 ， 数 据 值 的 顺序 也 必须 与 指定 的 列 的 顺序 一 致 。 例 如 ， 下 列 语句 可 用 于 
往 PRODUCT_T 表 中 插入 一 行 数据 ， 因 为 表 中 不 存在 产品 描述 信息 。 

命令 向 表 中 插入 一 行 数据 ， 其 中 有 一 些 属性 为 NULL。 

INSERT INTO PRODUCT_T(PRODUCT ID, PRODUCT DESCRIPTION， 


PRODUCT FINISH， STANDARD PRICE, PRODUCT ON_ HAND) 
VALUES(1, ‘End Table’', ‘Cherry', 175, 8); 


一 般 来 说 ，INSERT 命 令 根 据 语句 中 提供 的 值 插 入 一 个 新 行 到 表 中 ， 或 者 从 其 他 数据 库 中 
拷贝 一 行 或 多 行 数据 到 表 中 ， 或 者 从 一 个 表 中 提取 数据 插 人 到 另 一 个 表 中 。 当 想 要 增加 数据 到 
CA_CUSTOMER_T 表 时 ， 可 以 使 用 下 面 的 INSERT 命 令 。CA_CUSTOMER _T 表 与 
CUSTOMER_T 表 具有 相同 结构 ， 但 仅 只 含有 松 谷 家 具 公 司 在 加 利 福 尼 亚 州 的 顾客 。 

命令 用 另 一 个 具有 相同 结构 的 表 的 子 集 给 一 个 表 增 加 数据 。 


INSERT INTO CA CUSTOMER 人 
SELECT * FROM CUSTOMER T 
WHERE STATE='CA'; 


INSERT 命 令 中 定义 的 表 可 以 是 一 个 视图 ， 但 是 视图 必须 是 可 以 更 新 的 ， 这 样 ， 插 入 到 视 
图 中 的 数据 也 能 够 插入 到 基于 这 些 视 图 的 基 表 中 。 如 果 在 视图 的 定义 中 包括 了 WITH CHECK 
OPTION， 那 么 当 数据 值 不 能 满足 WITH CHECK OPTION 的 规格 说 明 时 ， 试 图 通过 视图 来 揪 入 
数据 的 要 求 会 被 拒绝 。 
7.7.1 批量 输入 

INSERT 命 令 用 于 一 次 输入 一 行 数 据 ， 也 可 以 用 于 插入 作为 查询 结果 的 多 行 数据 。 某 些 
SQL 版 本 有 专用 命令 或 实用 程序 来 批量 输入 多 行 数据 ， 即 INPUT 命 令 。Oracle 中 包含 
SQL*Loader 程 序 ， 它 从 命令 行 运行 ， 能 够 把 一 个 文件 的 数据 装载 到 数据 库 中 。 使 用 这 个 受 人 
欢迎 的 程序 需要 点 技巧 ， 它 不 在 本 书 的 讨论 范围 之 内 。 
7.7.2 删除 数据 库 内 容 

可 以 逐 行 删除 数据 也 可 以 按 组 删除 行 。 假 设 松 谷 家 具 公 司 决定 不 再 与 夏威夷 州 的 顾客 做 生 
意 ， 那 么 可 以 通过 下 面 的 命令 删除 CUSTOMER_T 表 中 地 址 为 Hawaii 的 顾客 的 所 有 行 。 

命令 ”从 CUSTOMER 表 中 删除 满足 一 定 条 件 的 行 。 

DELETE FROM CUSTOMER T 

WHERE STRATE= ' HT ' ， 

最 简单 的 DELETE 形 式 用 于 删除 表 中 所 有 的 行 。 

命令 “删除 CUSTOMER 表 中 所 有 的 行 。 

DELETE FROM CUSTOMER T; 

使 用 这 种 形式 的 命令 时 应 当 万 分 小 心 ! 

如 果 行 与 多 个 关系 有 关 ， 那 么 删除 时 也 应 当 小 心 。 例 如 ， 在 删除 与 CUSTOMER _T 相 关 的 
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ORDER_T 的 行 之 前 ， 如 果 我 们 要 删除 CUSTOMER_T 的 行 ， 那 么 就 违反 了 参照 完整 性 规则 ( 注 
意 : 在 字段 定义 中 使 用 ON DELETE 子 句 能 缓解 这 个 问题 ， 如 果 忘 记 了 ON DELETE 的 用 法 ， 可 
参考 本 章 的 7.6.4 节 )。SQL 确 实 能 删除 由 DELETE 命 令 选 定 的 记录 。 因 此 我 们 常常 会 先 执行 一 
个 SELECT 命令 ， 显 示 要 删除 的 记录 ， 从 而 核实 这 些 行 确实 是 那些 想 删 除 的 行 。 
7.7.3 修改 数据 库 内 容 

为 了 更 新 SQL 中 的 数据 ， 我 们 一 定 要 告知 DBMS ， 在 更 新 中 涉及 到 哪些 关系 、 列 、 行 。 如 
采 在 PRODUCT_T 表 中 ， 输 入 的 餐桌 价格 不 正确 ， 那 么 下 列 SQL UPDTAB 语 句 可 以 更 正 它 。 

命令 ”在 PRODUCT_T 中 ， 把 产品 号 为 7 的 单价 修改 为 775。 

UPDATE PRODUCT 7T 


SET UNIT PRICE=775 
WHERE PRODUCT ID=7; 


SET 命令 也 可 以 把 值 置 为 NULL ， 其 语法 是 : “SET 列 名 = NULL”。 同 DELETE 命 令 一 样 ， 
UPDAITE 命 令 中 的 WHERE 子 名 可 以 包含 一 个 子 查询 ， 但 是 在 子 查询 中 不 能 引用 正在 被 更 新 的 
表 。 子 查询 将 在 第 8 章 中 讨论 。 


7.8 RDBMS 中 的 内 模式 定义 


控制 关系 数据 库 的 内 模式 可 以 提高 处 理 和 存储 的 效率 。 有 一 些 技术 可 以 用 于 调整 关系 数据 
库 内 部 数据 模型 的 操作 性 能 ， 这 些 技术 包括 : 

1) 选择 对 主键 和 (或 ) 辅助 键 索引 ， 从 而 提高 选择 行 、 联 结 表 和 排序 行 的 速度 ， 删 除 索 引 
可 以 提高 表 更 新 的 速度 。 你 可 以 回顾 第 6 章 中 关于 选择 索引 的 一 节 。 

2) 选择 基 表 的 文件 组 织 ， 使 它 与 这 些 表 中 的 处 理 活动 相 匹配 (例如 ， 按 照 一 个 经 常 使 用 的 
报表 排序 关键 字 对 表 进 行 物理 排序 )。 

3) 选择 索引 的 文件 组 织 方式 (索引 也 是 表 )， 使 它 适 合 于 索引 使 用 的 方式 。 为 索引 文件 分 
配额 外 的 空间 ， 这 样 不 用 重新 组 织 索 引 ， 索 引 也 能 够 扩展 。 

4) 聚 灸 数据 ， 使 得 频繁 联结 的 表 的 相关 行 可 以 在 二 级 存储 器 中 存放 在 一 起 ， 从 而 最 小 化 检 
索 时 间 。 

5) 维护 对 表 和 索引 的 统计 数据 ， 使 得 DBMS 能 够 找到 执行 各 种 数据 库 操作 的 最 有 效 的 办 法 。 
并 不 是 所 有 的 SQL 系统 都 会 使 用 这 里 提 到 的 每 一 项 技术 ， 但 是 最 常用 的 技术 是 索引 和 聚 入 ， 所 
以 下 面 几 节 我 们 将 讨论 关于 索引 和 娟 签 的 问题 。 
创建 索引 

大 部 分 RDBMS 都 会 创建 索引 ， 创 建 索 引 可 以 提高 随机 和 连续 访问 基 表 的 速度 。 由 于 ISO 
SQL 标准 一 般 不 处 理性 能 问题 ， 所 以 它 没有 包括 创建 索引 的 标准 语法 。 这 里 的 例子 使 用 的 是 
Oracle 语 法 ， 其 目的 是 说 明 在 大 多 数 RDBMS 中 如 何 处 理 索引 。 值 得 注意 的 是 ， 尽 管用 户 在 纺 
写 每 一 个 SQL 命令 时 并 没有 直接 涉及 索引 , 但 是 DBMS 知 道 哪个 现 有 的 索引 能 够 提高 查询 性 能 。 
通常 既 可 以 为 主键 和 辅助 键 创建 索引 ， 又 可 以 对 单 键 和 联结 键 (多 列 ) 创建 索引 。 在 一 些 系统 
中 ， 用 户 能 够 将 索引 中 的 键 按 升序 和 降序 排列 。 

例如 ， 我 们 在 Oracle 中 对 CUSTOMER_T 表 的 CUSTOMER_NAME 列 按 字母 顺序 创建 索引 。 

命令 在 CUSTOMER 表 中 ， 对 顾客 名 字 按 字母 顺序 创建 索引 。 


CREATE INDEX NAME IDX ON CUSTOMER T(CUSTOMER NAME ); 


索引 可 以 随时 创建 或 删除 。 如 果 在 关键 字 列 上 已 经 存在 数据 ， 那么 对 现 有 数据 的 索引 将 自 
动产 生 。 如 果 定义 索引 为 UNIQUE (使 用 CREATE UNIQUE INDEX 语 法 ) 且 现 有 数据 与 该 条 
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件 相 冲突 ， 那 么 将 不 能 创建 该 索引 。 一 旦 索引 创建 ， 则 在 数据 输入 、 更 新 或 删除 时 ， 索 引 也 将 
被 更 新 。 

当 不 再 需要 表 、 视 图 或 索引 时 ， 我 们 可 以 使 用 DROP 语 句 将 其 删除 。 例 如 ， 可 以 删除 
NAME_IDX 索 引 。 

命令 删除 CUSTOMER 表 中 对 顾客 名 的 索引 。 

DROP INDEX NAME IDX; 

尽管 可 以 对 表 中 每 一 个 列 进行 索引 ,但 是 每 当 决 定 创建 一 个 新 的 索引 时 ， 都 应 当 小心 。 因 
为 每 个 索引 都 会 消耗 额外 的 存储 空间 ， 并 且 一 旦 被 索引 的 数据 值 改变 ， 就 会 产生 维护 的 开销 。 
因此 ， 这 些 代 价 会 大 大 延长 检索 的 响应 时 间 ， 给 在 线 用 户 带 来 延迟 。 在 一 个 复杂 限定 条 件 下 ， 
即使 对 于 关键 字 有 多 个 索引 可 用 ， 系 统 也 可 能 只 选 一 个 索引 。 数 据 库 设 计 者 必须 确切 地 知道 ， 
特定 的 RDBMS 如 何 使 用 索引 ， 从 而 对 索引 作出 明智 的 选择 。Oracle 中 包含 一 个 Explain Plan 工 
具 , 可 以 用 它 来 查看 SQL 语句 的 处 理 顺序 和 将 要 使 用 的 索引 。 输 出 结果 中 包括 了 一 个 代价 评估 ， 
它 比 较 以 不 同 索 引 来 运行 语句 的 代价 ， 从 而 决定 哪个 索引 是 最 有 效 的 。 


7.9 处 理 单个 表 


在 SQL 中 ， 可 以 使 用 四 个 数据 操纵 语言 命令 。 我 们 已 经 简要 讨论 了 其 中 的 三 个 命令 
UPDATE、INSERTE 和 DELETE， 并 看 到 了 第 四 个 命令 SELECT 的 儿 个 例子 。UPDATE、 
INSERT 和 PELETE 命 令 可 以 修改 表 中 的 数据 ， 而 带 有 不 同 子 句 的 SELECT 命令 可 以 查询 表 中 的 
数据 ， 回 答 许 多 不 同 的 问题 ， 以 及 特定 查询 。SQL 命 令 的 基本 结构 十 分 简单 且 易 于 掌握 。 但 不 
要 被 这 个 表面 现象 迷惑 ，SQL 实 际 上 是 一 个 功能 强大 的 工具 ， 它 能 表示 复杂 的 数据 分 析 过 程 。 
然而 ， 由 于 SQL 的 基本 语法 相对 来 说 比较 容易 学 习 ， 所 以 常会 发 生 这 样 的 事情 : 写 出 来 的 SQL 
查询 语法 是 正确 的 ， 但 不 能 回答 需要 回答 的 那个 问题 。 所 以 在 对 一 个 大 型 工作 数据 库 进 行 查询 
之 前 ， 应 该 先 在 一 个 小 的 测试 数据 集 上 仔细 地 测试 查询 ， 以 确保 它们 能 返回 正确 的 结果 。 除 了 
人 工 检查 查询 结果 之 外 ， 还 可 以 把 查询 分 为 较 小 部 分 ， 检 查 这 些 简单 查询 的 结果 ， 然 后 把 这 些 
结果 合并 起 来 。 这 样 就 能 确保 查询 按照 预期 的 方式 工作 。 我 们 首先 学 习 只 作用 于 单个 表 的 SQL 
查询 。 在 第 8 章 中 ， 我 们 会 把 表 联结 起 来 ， 使 用 需要 多 张 表 的 数据 的 查询 。 

7.9.1 SELECT 语句 的 子 名 

大 多 数 SQL 数 据 检索 语句 包括 以 下 三 种 子 句 : 

SELECT 列 出 要 从 基 表 (或 视图 ) 投影 到 命令 的 结果 表 中 的 列 (包括 列 的 表达 式 )。 

FROM 指定 出 现在 结果 表 中 列 来 自 娜 个 表 或 视图 ， 同 时 包括 用 来 联结 表 以 处 理 查询 的 表 
和 视图 。 

WHERE 包括 在 单个 表 或 视图 中 选择 行 的 条 件 ， 以 及 表 或 视图 之 间 的 联结 条 件 。 

前 两 个 子 句 是 必需 的 ， 第 三 个 子 句 仅 在 检索 特定 的 行 ， 或 对 多 个 表 进 行 联结 时 才 需 要 。 本 
节 的 例子 是 从 图 7-3 的 数据 中 提取 出 来 的 。 在 下 面 这 个 例子 中 ， 我 们 随时 都 能 从 PRODUCT 视 图 
中 显示 标准 价格 低 于 $275 的 所 有 产品 的 产品 名 和 数量 。 

查询 6 哪些 产品 的 标准 价格 低 于 $275? 

SELECT PRODUCT NAME ， STANDARD PRICE 

FROM PRODUCT V 
WHERE STANDARD PRICE<275; 


结果 : 
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PRODUCT_NAME STANDRARD_PRICE 
End Table 175 
Computer Desk 250 
Coffee Table 200 


每 执行 一 个 SELECT 语句 ， 就 会 返回 一 个 结果 表 。 显 示 列 表 时 ， 可 以 使 用 两 个 特殊 的 关键 
字 : DISTINCT 和 *。 如 果 用 户 不 希望 在 结果 表 中 看 到 重复 的 行 ， 则 可 以 使 用 SELECT 
DISTINCT 命 令 。 在 上 一 个 例子 中 ， 假 如 松 谷 家 有 具 公 司 还 有 其 他 价格 低 于 $275 的 计算 机 桌 ， 查 
询 结果 中 将 出 现 重复 元 组 。 而 SELECT DISTINCT PRODUCT_NAME 将 显示 没有 重复 行 的 结果 
表 。SELECT * 显 示 FROM 子 句 中 所 有 表 和 视图 的 所 有 列 ， 这 里 的 * 是 指 所 有 列 的 通配符 。 

同时 ， 注 意 SELECT 语 名 的 子 句 必须 按 一 定 顺 序 排 列 ， 否 则 将 出 现 语法 错误 ， 从 而 导致 查 
询 不 能 执行 。 根 据 所 使 用 的 SQL 版 本 ， 限 定数 据 库 对 象 的 名 字 也 是 很 有 必要 的 。 如 果 在 SQL 命 
令 中 有 任何 模糊 之 处 ， 就 一 定 要 指明 所 要 求 的 数据 来 自 哪 张 表 和 视图 。 例 如 ， 在 图 7-3 中 ， 
CUSTOMER_ID 这 一 列 在 CUSTOMER_T 和 ORDER_T 中 都 存在 。 当 某 人 拥有 正在 使 用 的 数据 
库 〈 即 该 用 户 创建 了 此 表 ) ， 他 要 从 CUSTOMER_T 中 得 到 CUSTOMER_ID ， 就 需要 指定 
CUSTOMER_T.CUSTOMER_ID 来 说 明 需 要 的 表 。 同 样 ， 如 果 要 从 ORDER_T 中 得 到 
CUSTOMER_ID ， 就 需要 指定 ORDER_T.CUSTOMER_ID 来 说 明 需 要 的 表 。 即 使 他 不 在 音 从 哪 
个 表 得 到 CUSTOMER_ID ， 他 也 必须 明确 地 指定 表 ， 因 为 如 果 用 户 不 指定 ，SQL 就 不 能 处 理 模 
精 语句 。 当 使 用 他 人 创建 的 数据 时 ， 用 户 也 必须 通过 增加 表 的 所 有 者 的 用 户 ID 来 明确 指定 表 的 
所 有 者 。 一 个 从 CUSTOMER_T 表 中 选择 CUSTOMER_ID 的 语句 应 该 是 DOWNER_1D. 
CUSTOMER_T. CUSTOMER_ID。 本 书 的 例子 都 假定 读者 拥有 正在 使 用 的 表 或 视图 ， 因 为 没有 
限定 词 的 SELECT 语句 更 容易 阅读 。 在 必须 的 地 方 必 须 包 括 限 定 词 ， 在 你 认为 合适 的 语句 中 也 
可 以 包括 限定 词 。 遗 漏 限定 词 可 能 会 产生 问题 ， 但 包括 限定 词 是 不 会 产生 问题 的 。 

如 果 键 人 的 限定 词 和 列 名 有 些 乏 味 ， 或 者 对 那些 阅读 报表 的 人 来 说 ， 这 些 列 名 没有 意义 ， 
那么 可 以 为 列 、 表 和 视图 建立 别名 ， 这 样 在 查询 的 剩余 部 分 中 就 可 以 使 用 这 些 别 名 了 。 

查询 7 名 为 Home Furnishings 的 顾客 的 地 址 是 什么 ? 为 顾客 名 字 建 立 别名 NAME。 

SELECT CUST .CUSTOMER_NAME AS NAME, CUST.CUSTOMER ADDRESS 


FROM ownerid.CUSTOMER V CUST 
WHERE NAME='Home Furnishings';} 


在 许多 的 SQL 版 本 中 ， 这 个 检索 语句 可 以 得 到 下 面 的 结果 。 在 Oracle 的 SQL*Plus 中 ， 列 的 别名 
除了 可 以 在 HAVING 子 句 中 使 用 外 ， 不 能 在 SELECT 语句 的 其 他 子 句 中 使 用 ， 所 以 为 了 运行 该 
SQL 语句 ， 在 最 后 一 行 中 必须 使 用 CUSTOMER_NAME 而 不 是 NAME。 注 意 ， 打 印 出 来 列 的 标 
题 是 NAME 而 不 是 CUSTOMER_NAME; 对 于 视图 的 别名 ， 即使 它 直到 FROM 子 句 才 定 义 出 来 ， 
也 可 以 在 SELECT 子 句 中 使 用 。 


结果 : 

NAME CUSTOMER_ADDRESS 
一 -一 一- 一 ”一 
Home Furnishings 1900 Allard Ave. 


当 使 用 SELECT 子 句 为 结果 表 挑 选 列 时 ， 可 以 将 这 些 列 重 新 组 织 一 下 ， 使 得 它们 在 结果 表 
中 的 顺序 和 在 原来 的 表 中 的 顺序 有 所 不 同 。 事 实 上 ， 它 们 显示 的 顺序 和 在 SELECT 语句 中 定义 
的 顺序 相同 。 再 看 一 下 图 7-3 中 的 PRODUCT_T， 观 察 一 下 对 于 此 查询 ， 基 表 中 的 顺序 和 结果 
表 中 的 顺序 的 不 同 。 

查询 8 列 出 PRODUCT 表 中 所 有 产品 的 单价 、 产 品名 和 产品 ID。 
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SELECT STANDARD PRICE, PRODUCT DESCRIPTION，PRODUCT ID 
FROM PRODUCT_T; 





结果 : 

STANDRARD PRICE PRODUCT DESCRIPTION PRODUCT_ ID 
175 End Table 1 
200 Coffee Table 2 
375 Computer Desk 3 
650 Entertainment Center 4 
325 Writer's Desk 5 
750 8-Drawer Desk 6 
800 Dining Table 7 
250 Computer Desk 8 


8 rows selected. 


7.9.2 使 用 表达 式 

在 某 个 表 中 ， 使 用 最 基本 的 SELECT-FROM-WHERE 子 句 ， 还 可 以 处 理 其 他 一 些 事 情 。 你 
可 以 创建 表达 式 (expression)， 它 是 对 表 中 的 数据 进行 的 数学 运算 ; 也 可 以 利用 存储 函数 
(stored function)， 例 如 SUM 或 AVG、 来 处 理 从 表 中 选 定 的 数据 行 。 也 许 人 们 想 知 道 各 个 清单 
项 目的 平均 标准 价格 ， 为 了 得 到 这 个 平均 值 ， 可 以 使 用 AVG 存 储 函 数 。 给 这 个 结果 表达 式 取 名 
为 AVERAGE。 下 面 是 使 用 SQL*Plus 得 到 的 查询 和 结果 。 

查询 9 清单 中 各 个 产品 的 平均 标准 价格 是 多 少 ? 

SELECT AVG (STANDARD PRICE ) AS AVERAGE 

FROM PRODUCT V; 


可 以 通过 使 用 “二 ”( 加 )、“-”( 减 )、“*”( 乘 )、“/”( 除 ) 来 构建 数学 运算 。 这 些 操 作 符 能 
与 任何 数字 类 型 的 列 在 一 起 使 用 。 有 些 系统 还 有 模 (modulo ) 操作 符 ， 通 常用“%” 表 示 。 模 
是 两 个 整数 相 除 的 余数 ， 例 如 ，14%4 =2， 因 为 14/4=3， 余 数 为 2。 这 个 标准 还 支持 年 -月 和 
天 -时 间 的 间隔 ， 从 而 能 够 完成 日 期 和 时 间 算 术 运 算 。 注 意 ， 上 面 查询 得 到 的 结果 现在 显示 为 
表达 式 AVERAGE。 

结果 : 

AVERAGE 

440.625 


复杂 表达 式 中 的 顺序 优先 规则 与 其 他 程序 语言 和 关系 代数 中 使 用 的 优先 规则 是 一 样 的 。 首 
先 计算 括号 里 的 表达 式 ; 没有 括号 时 ， 先 从 左 至 右 计算 乘除 ， 然 后 从 左 至 右 计 算 加 减 。 为 了 避 
免 混 乱 ， 使 用 括号 来 明确 顺序 。 当 括号 筷 套 时 ， 最 先 完成 里 层 括号 的 计算 。 
7.9.3 使 用 函数 

在 SELECT 命令 的 列 的 列表 中 ， 对 于 指定 列 使 用 像 COUNT、MIN、MAX、 SUM 和 AVG 之 
类 的 函数 ， 可 以 指定 结果 表 中 包含 的 是 聚合 数据 ， 而 不 是 行 级 数据 。 使 用 其 中 的 任何 一 个 聚合 
函数 ， 都 将 得 到 一 行 值 。 

查询 10 1004 号 订单 订购 了 多 少 不 同 的 产品 ? 

SELECT COUNT(*) 

FROM ORDER LINE Vv 

WHERE ORDER ID=1004; 


结果 : 
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COUNT(*) 
2 

似乎 通过 修改 上 面 的 查询 ， 就 可 以 很 容易 地 显示 出 1004 号 订单 。 

查询 11 1004 号 订单 订购 了 多 少 种 不 同 产品 ， 分 别 列 出 这 些 产品 。 

SELECT PRODUCT 1D, COUNT(*) 


FROM ORDER LINE V 
WHERE ORDER_ID=1004; 


但 是 在 Oracie 中 ， 会 产生 这 样 的 结果 。 

结果 : 

ERROR at line 1: 

ORA~00937:not a single-group group function 


问题 在 于 ， 对 于 选中 的 两 行 ， PRODUCT_ID 返 回 两 个 值 6 和 8; 而 对 于 ID = 1004 的 行 集合 
来 说 ，COUNT 返 回 一 个 聚合 值 2。 在 大 多 数 实现 中 ，SQL 语 名 不 能 返回 一 行 值 和 一 个 集合 值 ， 
我 们 必须 运行 两 个 单独 的 查询 ， 一 个 查询 返回 行 信息 ， 另 一 个 查询 返回 集合 信息 。 

间 时 ， 范 数 COUNT() 和 COUNT 很 容易 混淆 。 上 面 所 使 用 的 COUNT(*)， 不 管 行 中 是 否 包 
含 空 值 ， 计 算 查 询 选 中 的 所 有 行 ; 而 COUNT 只 计算 有 值 的 行 ， 忽 略 所 有 的 空 值 。 

SUM 和 AVG 只 能 用 于 数字 类 型 的 列 。COUNT、COUNT(*)、MIN 和 MAX 能 与 任何 数据 类 
型 一 起 使 用 。 例 如 ， 在 文本 类 型 列 中 使 用 MIN， 可 以 找到 列 中 的 最 小 值 ， 这 个 值 的 首 字母 与 字 
母 表 的 开始 部 分 最 接近 。 不 同 SQL 的 实现 对 字母 表 的 顺序 有 不 同 的 解释 。 例 如 ， 有 些 系 统 从 
A ~Z 开 始 ， 然 后 是 a ~ z， 再 下 来 是 0 ~ 9 和 特殊 字符 ; 而 有 些 系统 不 区 分 大 小 写 ; 还 有 些 系统 
以 一 些 特殊 字符 开始 ， 然 后 依次 是 数字 、 字 母 和 其 他 特殊 字符 。 在 Oracle 中 ， 当 创建 了 一 个 数 
据 库 时 ， 语 言 字符 集 就 确定 了 ， 除 非 重建 数据 库 ， 否 则 就 无 法 对 该 语言 字符 集 进行 修改 。 当 客 
户 终端 使 用 不 同 的 字符 集 时 ，Oracle 自 动 地 转换 字符 集 ， 或 者 把 数据 库 字 符 集 转变 为 客户 终端 
的 字符 集 ， 或 者 把 客户 终端 的 字符 集 转换 为 数据 库 字 符 集 。 当 无 法 直接 转换 字符 集 时 ， 就 使 用 
替代 字符 。 下 面 有 一 个 查询 : 依照 字母 顺序 从 PRODUCT_T 表 中 找到 第 一 个 PRODUCT_NAME 
(使 用 的 是 Oracle 8; 中 的 AMERICAN 字 符 集 )。 

查询 12 在 PRODUCT 表 中 ， 依 照 字母 顺序 ， 查 询 到 的 第 一 个 产品 名 是 什么 ? 

SELECT MIN(PRODUCT DESCRIPTION) 

FROM PRODUCT V; 


下 面 给 出 了 结果 ， 从 结果 可 以 看 出 ， 在 这 个 字符 集中 ， 数 字 排 在 字母 之 前 。 
结果 : 

MIN(PRODUCT DESCRIPTION) 

8-Drawer Desk 


7.9.4 使 用 通配符 

前 面 我 们 已 经 展示 了 在 一 条 SELECT 语句 中 ， 将 星 号 (*) 作为 通配符 使 用 的 情形 。 通 配 
符 也 可 用 在 不 能 准确 匹配 的 WHERE 子 名 中 。 在 这 里 ， 关 键 字 LIKE 与 通配符 以 及 字符 串 在 一 起 
配对 使 用 ， 该 字符 串 包含 已 经 知道 的 需要 匹配 的 字符 。% 通 配 符 代 表 任何 字符 集 ， 因 此 在 搜索 
PRODUCT_DESCRIPTION 时 ， 使 用 LIKR “%DESK 就 能 够 找到 松 谷 家 具 公 司 生产 的 不 同型 号 
的 桌子 。 下划线 (-) 作为 通配符 时 仅仅 代表 一 个 字符 ,而 不 是 字符 集 。 因 此 当 搜 索 
PRODUCT_NAME 了 时 ， 使 用 LIKE '_-drawer’ 可 以 找到 所 有 有 特定 抽 居 的 产品 ， 比 如 3-drawer、 
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5-drawer 和 8-drawer 的 梳妆 台 。 表 7-3 SQL 中 的 比较 运算 符 
7.9.5 比较 运算 符 运算 符 全 义 
除了 本 节 第 一 个 SQL 例 子 之 外 ， 我 们 在 其 他 例 - 等 

子 的 WHERE 子 句 中 都 使 用 了 等 于 比较 运算 符 。 第 一 > 大工 

个 例子 使 用 的 是 大 于 (小于) 运算 符 。SQL 中 最 常 >- 大 等 
用 的 比较 运算 符 在 表 7-3 中 列 出 。 在 数字 数据 间 通 常 。 。” < 人 
会 使 用 比较 运算 符 ， 但 在 SQL 中 ， 用 户 也 可 以 为 字 三 A 
符 数据 和 日 期 数据 使 用 比较 运算 符 。 下 面 的 例子 要 - 不 等 


求 查询 自 2000 年 10 月 24 日 以 来 所 有 发 出 的 订单 。 
查询 13 ”查询 2000 年 10 月 24 日 以 来 所 有 发 出 的 订单 。 
SELECT ORDER ID, ORDER DATE 
FROM ORDER_V 
WHERE ORDER DATE>'24-0CT-2000'; 


注意 ， 日 期 用 单 引 号 括 起 ， 这 种 日 期 格式 与 图 7-3 所 示 的 格式 不 同 ， 图 7-3 取 自 MS-Access。 
该 查询 运行 企 SQL*Plus 中 。 


结果 : 

ORDER _ID ORDER_DRATE 
1007 27-NOV-00 
1008 30-0CT-00 
1009 05-NOV-00 
1010 05_NOV-00 


查询 14 查询 松 谷 家 具 公 司 中 不 是 用 cherry (樱桃 木 ) 做 成 的 家 具 。 
SELECT PRODUCT DESCRIPTION, PRODUCT FINISH 
FROM PRODUCT_V 

WHERE PRODUCT FINISH!='Cherry'; 


结果 : 

PRODUCT PRODUCT FINISH 
Coffee Table Natural Ash 
Computer Desk Natural Ash 
Entertainment Center Natural Maple 
8-Drawer Desk White Ash 
Dining Table Natural Ash 
Computer Desk Walnut 


6 rows selected. 


7.9.6 使 用 布尔 运算 符 

通过 进一步 调整 WHERE 子 句 ， 可 以 解决 更 复杂 问题 。 利 用 布尔 (或 逻辑 ) 运算 符 AND、 
OR 和 NOT 可 以 达到 这 一 目的 。 

“AND 联结 两 个 或 多 个 条 件 ， 仅 当 所 有 条 件 都 为 真 时 才 返 回 结果 。 

*OR 联结 两 个 或 多 个 条 件 ， 当 任 一 条 件 为 真 时 就 能 返回 结果 。 

“NOT 对 表达 式 取 否 。 

如 果 在 SQL 语句 中 有 多 个 布尔 运算 符 ， 那 么 先 判定 NOT， 然 后 判定 AND ， 最 后 判定 OR。 
比如 ， 考 察 下 列 查询 。 
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查询 15 在 PRODUCT 视 图 中 ， 列 出 所 有 的 办 公 桌 (desk) 以 及 单价 大 于 $300 的 餐桌 
(table) 的 产品 名 、 材 料 和 单价 。 
SELECT PRODUCT DESCRIPTION, PRODUCT FINISH, STANDARD PRICE 
FROM PRODUCT_V 
WHERE PRODUCT_ DESCRIPTION LIKE '%Desk' 
OR PRODUCT_ DESCRIPTION LIKE '%Table’ 
AND UNIT_PRICE>300; 


这 里 ， 列 出 了 所 有 Desk， 蕉 至 包括 单价 小 于 $300 的 Computer Desk。 仅 有 一 张 Table 列 出 来 ， 


单价 不 到 $300 的 廉价 Table 没 有 列 出 来 。 看 看 查询 语句 ， 先 处 理 AND， 返 回 所 有 单价 大 于 $300 
的 Table。 然 后 处 理 OR， 返 回 所 有 Desk， 而 无 须 考虑 价格 。 


结果 : 

PRODUCT_ DESCRIPTION PRODUCT FINISH STANDARD _ PRICE 
Computer Desk Natural Ash 375 
Writer's Desk Cherry 325 
8-Drawer Desk white Ash 750 
Dining Table Natural Ash 800 
Computer Desk Walnut 250 


如 果 我 们 只 想 列 出 单价 大 于 $300 的 Desk 和 Table， 那 么 我 们 应 该 在 WHERE 之 后 、AND 之 前 
放 上 括号 。 
查询 16 在 PRODUCT 视 图 中 ， 列 出 所 有 单价 大 于 $300 的 Desk 和 Table 的 产品 名 、 材 料 和 单 
价 。 
SELECT PRODUCT DESCRIPTION, PRODUCT FINISH, UNIT PRICE 
FROM PRODUCT V 
WHERE (PRODUCT NAME LIKE '%Desk' 
OR PRODUCT NAME LIKE '%Table') 
AND UNIT PRICE>300; 


现在 返回 的 结果 显示 如 下 ， 仅 仅 包括 那些 单价 大 于 $300 的 产品 。 


结果 : 

PRODUCT DESCRIPTION PRODUCT FINISH STANDARD PRICE 
oi 
Computer Desk Natural Ash 375 
Writer's Desk Cherry 325 
8-Drawer Desk White Ash 750 
Dining Table Natural Ash 800 

7.9.7 范围 


比较 运算 符 “<” 和 “>” 可 用 来 确定 值 的 范围 ， 也 可 以 使 用 关键 字 BETWEEN 或 NOT 
BETWEEN 来 确定 值 的 范围 。 例 如 ， 找 出 标准 价格 在 $200 和 $300 之 间 的 产品 ， 使 用 如 下 查询 。 
查询 17 在 PRODUCT 视 图 中 ， 标 准 价 格 在 $200 和 $300 之 间 的 产品 有 哪些 ? 


SELECT PRODUCT DESCRIPTION, STANDARD PRICE 
FROM PRODUCT V 
WHERE STANDARD PRICE>199 AND STANDARD PRICE<301; 


结果 : 
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PRODUCT NANME STANDARD PRICE 
Coffee Table 200 
Computer Desk 250 


下 面 这 个 查询 也 返回 同样 的 结果 。 
查询 18 在 PRODUCT 视 图 中 ， 标 准 价格 在 $200 和 $300 之 人 的 产品 有 哪些 ? 


SELECT PRODUCT DESCRIPTION, STANDARD PRICE 
FROM PRODUCT V 
WHERE STANDARD PRICE BETWEEN 200 AND 300; 


结果 : 同 前 一 查询 。 

在 这 个 查询 中 的 BETWEEN 之 前 增加 NOT， 将 返回 PRODUCT_V 中 所 有 其 他 的 产品 ， 因 为 
它们 的 单价 小 于 $200 或 大 于 $300。 
7.9.8 DISTINCT 

有 时 ， 当 返回 不 包含 主键 的 行 时 ， 可 能 会 出 现 重复 的 行 。 例 如 ， 考 察 下 面 的 查询 和 它 返 回 
的 结果 。 

查询 19 包含 在 ORDER_LINE 表 中 的 订单 号 有 哪些 ? 


SELECT ORDER_ID 
FROM ORDER LINE T; 


该 查询 返回 18 行 结果 ， 由 于 许多 订单 有 多 项 ， 所 以 它们 中 有 许多 是 重复 的 。 
结果 : 
ORDER_ID 
oor 
1001 
1001 
1002 
1003 
1004 
1004 
1005 
1006 
1006 
1006 
1007 
1007 
1008 
1008 
1009 
1009 
1010 


18 rows selected. 


然而 ， 如 果 我 们 加 入 关键 字 DISTINCT， 那 么 每 个 ORDER_ID 在 返回 时 只 出 现 一 次 ， 在 表 
中 ， 这 10 个 订单 分 别 只 出 现 一 次 。 
查询 20 包含 在 ORDER_LINE 表 中 的 订单 号 有 哪些 ? 
SELECT DISTINCT ORDER TD 
FROM ORDER LINE V; 
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结果 : 

ORDER_ID 
1001 
1002 
1003 
1004 
1005 
1006 
1007 
1008 
1009 
1010 


10 rows selected. 


DISTINCT (以 及 与 它 相 对 应 的 ALL) 在 SELECT 语句 中 只 能 使 用 一 次 。 它 出 现在 SELECT 
语句 之 后 ， 所 有 要 列 出 的 列 或 者 表达 式 之 前 。 如 果 SELECT 语 名 投影 多 个 列 ， 那 么 每 一 列 都 相 
问 的 行 就 不 再 显示 。 因 此 如 果 上 述 语 句 还 包括 QUANTITY ， 将 会 返回 14 行 ， 因 为 现在 只 有 4 个 
重复 行 而 不 是 8 个 重复 行 。 例 如 ，ORDER_ID 1004 上 两 个 订单 的 数量 都 为 2， 那 么 就 删除 第 二 
个 1004 和 2。 


查询 21 包含 在 ORDER_LINE 表 中 ， 不 重复 的 订单 号 和 订单 数量 组 合 有 哪些 ? 


SELECT DISTINCT ORDER_ID， ORDERED QUANTITY 
FROM ORDER LINE V; 


结果 : 
ORDER_ID QUANTITY 
1001 
1001 
1002 
1003 
1004 
1005 
1006 
1006 
1007 
1007 
1008 
1009 
1009 
1010 


[i 


Ln 
© 


14 rows selected. 


7.9.9 IN 和 NOT IN 列 表 
使 用 IN 可 以 匹配 一 系列 值 。 
查询 22 列 出 所 处 的 州 的 顾客 。 


SELECT CUSTOMER NAME, CITY, STATE 
FROM CUSTOMER V 
WHERE STATE IN ( "FL ' ， 'TX', 'CA', ‘HI'); 
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结果 : 

CUSTOMER NAME CITY ST 
Contemporary Casuals Gainesville FL 
Value Furniture Plano TX 
Impressions Sacramento CA 
California Classics Santa Clara CA 
M and H Casual Furniture Clearwater FL 
Seminole Interiors Seminole FL 
Kaneohe Homes Kaneohe HI 


7 rows selected. . 
在 使 用 子 查询 的 SQL 语句 中 ，IN 特 别 有 用 、 这 将 在 第 8 章 中 讨论 。 
7.9.10 排序 结果 : ORDER BY 子 名 
观察 前 面 得 到 的 结果 ， 似 乎 先 显示 California 顾 客 ， 然 后 显示 Florida 顾 客 、Hawaii 顾 客 、 
Texas 顾 客 才 更 为 合理 。 这 里 我 们 给 出 SQL 语句 的 其 他 个 基本 部 分 : 
“ORDER BY 将 结果 中 的 行 按 升序 或 降序 排列 。 
“GROUP BY 对 中 间 结 果 表 中 的 行进 行 分 组 ， 那 些 归 为 一 组 的 行 、 其 值 在 一 列 或 多 列 上 
是 相等 的 。 
“HAVING 只 能 在 GROUP BY 之 后 使 用 ， 作 为 -个 辅助 WHERE 子 句 ， 仅 返回 那些 满足 特 
定 条 件 的 组 。 
因此 ， 我 们 可 以 通过 增加 ORDER BY 地名 来 对 顾客 排序 。 
查询 23 ”在 CUSTOMER 视 图 中 ， 列 出 地 址 为 Florida、Texas、 California 或 Hawaii 的 所 有 顾客 
的 CUSTOMER_NAME、CITY 和 STATE。 依 字母 顺序 ， 先 按 州 ， 然 后 按 州 中 的 顾客 名 显示 顾客 。 


SELECT CUSTOMER NAME, CITY, STATE 
FROM CUSTOMER V 
WHERE STRATEIN( FL ， 'TX', 'CA', ‘'HI') 
ORDER BY STATE, CUSTOMER NAME; 


现在 的 结果 更 容易 阅读 。 


结果 : 

CUSTOMER NAME CITY Sm 
California Classics Santa Clara CRA 
impressions Sacramento CRA 
Contemporary Casuals Gainesville FL 
M and H Casual Furniture Clearwater FL 
Seminole Interiors Seminole FL 
Kaneohe Homes Kaneohe HI 
Value Furniture Plano TX 


7 rows selected. 


注意 ， 同 一 个 州 的 所 有 顾客 放 在 一 起 ， 在 每 个 州 内 ， 顾 客 名 按 字 母 顺 序 排列 。 这 种 排序 是 由 
ORDER BY 子 句 中 所 列 出 的 列 的 顺序 所 决定 。 在 本 例 中 , 先 将 州 按 字母 排列 ,然后 排序 顾客 名 。 
如 果 想 从 高 到 低 排序 、 那 么 在 排序 的 列 后 面 放置 一 个 DESC 关 键 字 即 可 。 

NULL 如 何 排序 呢 ? SQL-92 规 定 ， 空 值 可 以 放 在 最 前 或 最 后 ， 即 有 值 的 列 的 前 面 或 后 面 。 
NULL 放 在 什么 地 方 取决 于 SQL 的 具体 实现 。 在 SQL*Plus 中 ，NULL 排 在 最 后 。 
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7.9.11 分 类 结果 : GROUP BY 子 句 

GROUP BY 子 句 与 聚合 国 数 (如 SUM 或 COUNT ) 一 起 使 用 时 特别 有 用 。GROUP BY 把 一 
个 表 分 为 子 集 ( 按 组 )， 然 后 使 用 聚合 函数 为 每 个 组 生成 汇总 信息 。 由 前 面 聚合 函数 例子 返回 
的 单个 值 称 为 标量 聚合 (scalar aggregate)， 当 在 GROUP BY 子 句 使 用 聚合 函数 且 返 回 多 个 什 
时 ， 则 称 为 向 量 聚合 (vector aggregate ) 。 

查询 24 统计 我 们 向 其 发 货 的 、 各 个 州 的 顾客 总 数 。 

SELECT STATE, COUNT(STATE) 


FROM CUSTOMER V 
GROUP BY STATE; 


结果 : 
ST COUNT (STATE ) 
CR 2 
co 
FL 
HI 
MI 
NJ 
NY 
PA 
TX 
UT 
WA 





PDP- 


11 rows selected. 


也 可 以 在 组 内 嵌 套 组 ; 在 对 多 个 项 排序 时 ， 也 可 使 用 同样 的 逻辑 。 
查询 25 统计 我 们 向 其 发 货 的 、 各 个 城市 的 顾客 数 ， 按 州 显示 城市 . 
SELECT STATE, CITY, COUNT(CITY) 

FROM CUSTOMER V 
GROUP BY STATE, CITY; 


GROUP BY 子 句 看 似 简单 ， 但 如 果 忽 格子 句 的 逻辑 ， 就 有 可 能 产生 不 可 预料 的 错误 。 当 有 
GROUP BY 子 句 时 ， 可 以 在 SELECT 子 句 中 指定 的 列 就 会 受到 限制 ， 因 为 只 能 包括 那些 对 于 每 
个 组 只 有 一 个 值 的 列 。 在 上 面 的 查询 中 ， 每 一 组 包含 了 一 个 城市 和 城市 所 在 的 州 。SELECT 语 
句 包括 “city” 和 “state” 两 列 。 由 于 每 个 城市 和 州 的 组 合 只 有 一 个 值 ， 所 以 这 条 语句 有 效 。 
但 是 ， 如 果 本 节 第 一 个 查询 的 SELECT 子 句 还 包含 “city”， 那 么 由 于 GROUP BY 子 句 只 含有 州 ， 
那么 这 条 语句 将 出 错 。 由 于 州 可 能 有 多 个 城市 ， 而 SELECT 子 句 中 的 每 个 值 只 能 对 应 GROUP 
BY 组 中 的 一 个 值 的 要 求 不 能 满足 ， 因 此 SQL 不 能 表达 有 意义 的 城市 信息 。 一 般 而 言 ，SELECT 
语句 中 引用 的 每 个 列 必 须 在 GROUP BY 子 句 中 被 引用 ， 除非 这 一 列 是 一 个 包含 在 SELECT 子 名 
中 的 聚合 函数 的 参数 。 

7.9.12 通过 分 类 限定 结果 : HAVING 子 名 

HAVYING 子 句 与 WHERE 子 句 类 似 ， 但 它 指定 满足 条 件 的 组 ， 而 不 是 行 ， 因 此 通常 会 看 到 
HAVING 子 句 跟 在 GROUP BY 子 句 之 后 。 

查询 26 只 查找 有 多 个 顾客 的 州 。 

SELECT STATE, COUNT (STATE ) 

FROM CUSTOMER V 
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GROUP BY STATE 
HAVING COUNT(STATE)>1; 


该 查询 返回 这 样 一 个 结果 ， 它 删除 前 面 看 到 的 只 有 一 个 顾客 的 那些 州 。 记 住 ， 这 里 使 用 
WHERE 就 无 法 工作 、 因 为 WHERE 不 允许 聚合 。 更 进一步 说 ，WHERE 限 定 行 ， 而 HAVING 限 


定 组 。 
结果 : 
sT COUNT (STATE ) 
CRA 2 
FL 3 
NJ 2 


如 果 要 在 HAVING 子 名 中 包含 多 个 条 件 ， 可 以 像 企 WHERE 子 句 中 一 样 使 用 AND、OR 和 NOT。 

为 了 进行 归纳 ， 这 里 给 出 一 个 命令 ， 其 中 包含 了 全 部 六 种 子 句 ， 记 住 子 名 必须 按 这 样 顺序 使 用 。 
查询 27 ”对 平均 标准 价格 小 于 750 的 材料 分 组 ， 为 每 个 组 列 出 产品 的 材料 和 平均 标准 价格 。 
SELECT PRODUCT_FINISH, AVG(STANDARD PRICE) 


FROM PRODUCT V 
WHERE PRODUCT FINISH IN( Cherry ，Natural Rsh'，Natural Maple'，'White Ash') 

















GROUP BY PRODUCT FINISH 一 
HAVING AVG(STANDRRD_PRICE)<750 FROM 
ORDER BY PRODUCT FINISH; 人 确定 需要 用 到 的 表 
结果 : 
PRODUCT FINISH AVG{UNIT PRICE) | 
Cherry 250 WHERE 
全 2 人 的 ] 生 了 
Natural Rsh 458.333333 找 出 符合 条 件 的 行 
Natural Maple 650 mm 







GROUP BY 
根据 声明 的 列 中 的 | 一 
值 重 新 组 织 行 


图 7-8 显 示 了 SQL 处 理 语句 中 子 名 的 顺序 。 箭 头 表 示 处 理 
的 路 径 。 记 住 ， 只 有 SELECT 和 FROM 子 句 是 必须 的 。 注 意 ， 
这 里 的 处 理 顺序 与 创建 语句 使 用 的 语法 顺序 不 同 。 每 个 子 名 
一 旦 执行 ， 就 会 产生 一 个 中 间 结 果 表 ， 它 供 下 一 个 子 句 中 使 
用 。 用 户 不 会 看 到 中 间 结 果 表 ， 只 能 看 到 最 终 的 结果 。 记 住 
图 7-8 中 的 顺序 ， 就 可 以 根据 此 顺序 调试 一 个 查询 。 先 去 除 可 








HAVING 
找 出 符合 
要 求 的 组 












选 的 子 句 ， 然 后 按照 它们 处 理 的 顺序 一 次 放 回 一 个 子 句 。 通 [一 一 一 

过 这 种 方式 ， 就 能 够 看 见 中 间 结 果 ， 通 常 也 能 发 现 错误 。 L SELECT 
信 定 需要 的 列 

本 章 小 结 : 






本 章 介绍 了 用 于 关系 数据 库 定义 (DDL)、 操 纵 (DML) ORDER BY 
和 控制 (DCL) 的 SQL 语言 ， 它 通常 用 来 定义 和 查询 关系 数 对 行进 行 排序 
据 库 管理 系统 (RDBMS )。 这 个 标准 由 于 存在 许多 缺陷 而 遭 
受 批 评 ， 为 了 解决 这 些 缺陷 ， 提 高 语言 的 功能 ，ANSI X3H2 
委员 会 和 ISO/IEC JTC1/SC21/WG3 DBL 对 其 进行 了 修改 ， 发 针 
布 了 它 的 扩展 版 本 ， 目 前 的 标准 被 称 为 SQL-99。 

SQL 标 准 的 建立 和 一 致 性 证 明 测试 促使 关系 系统 在 当前 本 
数据 库 新 的 发 展 中 到 源 占据 主导 地 位 。 使 用 SQL 标准 的 好 处 《了 关 SQL 证人 的 外 和 
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包括 可 以 减少 培训 费用 ， 提 高 生产 率 、 增 加 应 用 程序 的 可 移植 性 和 持久 性 ， 减 少 对 个 别 厂商 的 
依赖 性 ， 以 及 提高 交叉 系统 的 通信 。 

SQL 环境 包括 一 个 SQL DBMS 的 实例 ， 以 及 可 以 访问 的 数据 库 及 相关 的 用 户 和 程序 。 每 个 
数据 库 包 含 在 目录 中 ， 并 且 有 一 个 描述 数据 库 对 象 的 模式 。 包 含 在 目录 中 的 信息 由 DBMS 自 身 
维护 ,而 不 是 由 DBMS 的 用 户 维护 。 

SQL 的 数据 定义 语言 (DDL) 命令 用 来 定义 一 个 数据 库 ， 包 括 数据 库 的 创建 以 及 数据 库 中 
表 、 索 引 和 视图 的 创建 。 参照 完 整 性 也 是 通过 DDL 命 令 建立 的 。SQL 的 数据 操纵 语言 (DML) 
命令 通过 使 用 SELECT 命令 来 加 载 、 更 新 和 查询 数据 库 。 数 据 控制 语言 (DCL ) 命令 用 来 创建 
用 户 对 数据 库 的 访问 。 

SQL 命令 能 直接 影响 包含 原始 数据 的 基 表 ， 也 能 影响 已 创建 的 数据 库 视 图 。 对 视图 的 修改 
和 更 新 可 以 (也 可 以 不 ) 传递 给 基 表 。SQL SELECT 语句 的 基本 语法 包括 以 下 关键 字 ; 
SELECT、FROM、WHERE、ORDER BY 和 HAVING。 SELECT 决定 在 查询 结果 表 中 显示 哪些 
属性 ，FROM 决 定 查询 中 使 用 哪些 表 或 视图 ; WHERE 设 定 查询 的 条 件 ， 包 括 必要 的 多 个 表 之 
间 的 任意 联结 ，ORDER BY 决定 显示 的 结果 的 顺序 ;GROUP BY 用 来 对 结果 分 类 ， 且 可 以 返回 
标量 聚合 或 者 向 量 聚 合 ; HAVING 通 过 分 类 来 限定 结果 。 

理解 本 章 介绍 的 基本 SQL 语法 ， 能 够 使 读者 尝试 有 效 使 用 SQL。 通 过 不 断 的 实践 ， 读 者 可 
以 进一步 理解 更 复杂 的 查询 。SQL 的 高 级 主题 将 在 第 8 章 中 讨论 。 


本 章 复 习 
关键 术语 
基 表 数据 操纵 语言 (DML) ”关系 数据 库 管理 系统 (RDBMS) 
目录 动态 视图 标量 诊 合 
数据 控制 语言 (DCL) ”物化 视图 模式 
数据 定义 语言 (DDL) ”参照 完整 性 向 量 聚 合 
复习 问题 
1. 定义 下 列 每 个 术语 。 
a. 基 表 b. 数据 定义 语言 
c. 数据 操纵 语言 d. 动态 视图 
e. 物化 视图 f. 参照 完整 性 


g. 关系 数据 库 管理 系统 (RDBMS ) h. 模式 
. 匹配 下 列 术语 及 其 定义 。 


iD 





_ ”视图 a. 值 列表 
参照 完整 性 b. 数据 库 描述 
一 动态 视图 c. 作为 使 用 视图 的 SQL 查 询 结果 的 被 物化 的 视图 
_ 物化 视图 d. 逻辑 表 
SQL-99 e. 缺失 或 不 存在 的 值 

空 值 f. 对 一 个 数据 库 中 数据 对 象 的 描述 
标量 聚合 g. 嵌入 SQL 命令 的 第 三 代 程 序 语 言 
_ 向量 聚合 h. 在 关系 数据 模型 使 用 外 键 来 建立 
目录 i. 作为 一 张 表 存在 的 视图 


模式 标准 关系 查询 和 定义 语言 
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_ 宿主 语言 k. 单个 值 

3. 对 比 下 列 术 语 。 
a. 基 表 ; 视图 b. 动态 视图 ; 物化 视图 
c. 目录 ; 模式 


4. 什么 是 SQL-92 和 SQL-99? 简要 描述 SQL-99 与 SQL-92 的 不 同 。 

5. 描述 关系 DBMS (RDBMS )， 包 括 它 的 基本 数据 模型 、 数 据 存 储 结构 以 及 数据 联系 建立 
的 方式 。 

6. 列 出 采用 广泛 接受 的 SQL 标准 所 带 来 的 六 个 潜在 的 好 处 。 

7. 描述 一 个 典型 SQL 环境 的 组 件 和 结构 。 

8. 描述 数据 定义 命令 、 数 据 操纵 语言 和 数据 控制 语言 的 区 别 。 

9. 解释 在 符合 SQL-92 标 准 的 数据 库 中 建立 参照 完整 性 的 方法 。 解 释 ON UPDATE 
RESTRICT、ON UPDATE CASCADE 和 ON UPDATE SETNULL 子 句 有 何不 同 。 如 果 使 用 ON 
DELETE CASCADE 子 句 会 发 生 什么 ? 

10. 解释 使 用 SQL 创 建 视图 的 几 种 可 能 日 的 。 特 别 要 解释 一 下 如 何 利 用 视图 增强 数据 安全 性 。 

11. 解释 当 通 过 视图 引用 数据 时 ， 为 什么 要 限制 数据 更 新 操作 的 种 类 ? 

12. 描述 使 用 视图 能 节省 重新 编程 工作 的 环境 集 。 

13. 利用 前 一 章 所 讲 的 内 容 ， 解 释 在 SQL 中 ， 决 定 是 否 要 为 一 张 表 建立 关键 字 索 引 时 所 需 
考虑 的 因素 。 

14. 解释 并 至 少 举 出 一 个 例子 来 解释 在 SQL 中 如 何 限定 某 人 对 一 张 表 的 所 有 权 。 

15. 出 现在 结果 表 中 的 属性 的 次 序 是 如 何 改变 的 ? 列 的 标题 是 如 何 改变 的 ? 

16. 在 SQL 中 ，COUNT、COUNT DISTINCT 和 COUNT(*) 有 哪些 区 别 ? 在 哪些 情况 下 这 三 
个 命令 会 产生 相同 的 结果 ? 哪些 情况 下 会 产生 不 同 的 结果 ? 

17. 在 SQL 命令 中 ， 布 尔 操作 符 (AND、OR、NOT ) 的 判定 次 序 是 什么 ”如 何 才能 确保 操 
作 符 是 按期 望 的 顺序 工作 ? 

18. 如 采 SQL 语 名 包括 GROUP BY 子 句 ，SELECT 语 名 中 能 够 请 求 的 属性 就 会 受到 限制 ， 
请 说 明 这 种 限制 。 
问题 和 练习 

问题 与 练习 1 ~ 9 是 基于 第 4 章 图 4-16 所 描述 的 课程 计划 ERD 来 完成 的 。 图 7-9 中 多 次 提 到 
3NE 关 系 与 一 些 示例 数据 。 对 于 问题 4 ~ 9， 男 - 张 实例 图 ， 在 图 中 标记 结果 表 中 查询 返回 的 
数据 。 


























STUDENT (STUDENT ID, STUDENT_NAME) IS_QUALIFIED (FACULTY ID, COURSE ID, DATE_QUALIFIED) 
3TUDENT_ID | STUDENT_NAME FACULTY _ID COURSE ID | DATE_QUALIFIED 
十 
38214 Letersky 2143 ISM 3112 9/1988 
54907 Altvater 2143 ISM 3113 9/1988 
66324 Aiken 3467 ISM 4212 9/1995 
70542 Marra 3467 ISM 4930 9/1996 
。。。 4756 ISM 3113 9/1991 
4756 ISM 3112 9/1991 











图 7-9 班级 安排 关系 
(没有 给 出 IS_ASSIGNED) 
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FACULTY (FACULTY ID, FACULTY_NAME) SECTION (SECTION_ID, COURSE_ID) 
f [ 

FACULTY_ID | FACULTY_NAME SECTION_ID | COURSE_ID 

2143 Birkin 2712 JISM 3113 

3487 Berndt 2713 ISM 3113 

4756 Co11ins 2714 ISM 4212 

2715 ISM 4930 

COURSE (COURSE _ 1D, COURSE_NAME) IS_REGISTERED (STUDENT ID, SECTION_ID, SEMESTER) 

COURSE_ID COURSE NAME STUDENT_ID | SECTION_ID | SEMESTER 

| 

ISM 3113 Syst Analysis 

ISM 3112 Syst Design 

ISM 4212 Database 

ISM 4930 Networking 

图 7-9 《〈 续 ) 
1. 对 于 所 显示 的 每 个 关系 ， 使 用 SQL DDL 写 出 它们 的 数据 库 描述 (针对 你 的 SQL 版 本 ， 必 


要 时 可 以 缩短 、 简 写 或 者 修改 数据 名 字 )。 假 设 属 性 的 数据 类 型 如 下 : 
STUDENT_ID (integer, primary key) 
STUDENT NAME (25 characters) 


FACULTY_ID (integer, primary key) 
FACULTY NAME (25 characters) 


COURSE_ID (8 characters, primary key) 
COURSE NAME (15 characters) 

DATE QUALIFIED (date) 

SECTION_ID (integer, primary key) 
SEMESTER (7 characters) 


2. 使 用 SQL 定义 下 列 视图 : 





STUDENT _ID STUDENT_ NAME 
38214 Letersky 
54907 Altvater 
54907 Altvater 
66324 Aiken 


3. 在 向 SECTION 表 中 插入 任意 一 行 数据 之 前 ， 准 备 输入 的 COURSE_ID 必 须 已 经 存在 于 
COURSE 表 中 【参照 完整 性 )。 写 一 个 实施 此 约束 的 SQL 断言 。 
4. 写 出 下 列 查询 的 SQL 定义 命令 。 
a. 如 何 向 STUDENT 表 中 增加 一 个 CLASS 属性 ? 
b. 如 何 删除 IS_REGISTERED 表 ? 
c. 如 何 把 FACULTY_NAME 字 段 从 25 个 字符 改 为 40 个 字符 ? 
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5.a. 创建 两 种 不 同形 式 的 INSERT 命 令 ， 在 STUDENT 表 中 增加 一 个 ID 为 65798 ， 姓 为 
Lopez 的 学 牛 。 
b. 编写 一 个 从 STUDENT 表 中 删除 Lopez 的 命令 。 
c. 创建 一 个 SQL 命令 ， 把 课程 TSM 4212 的 名 称 从 “Database” 修 改 为 “Introduction to 
Relational Database” 。 
写 出 回答 下 列 问题 的 SQL 命令 : 
a. 哪些 学 生 的 ID 号 小 于 $0 000? 
b. 教 职 工 ID 为 4756 的 教 职 工 的 姓名 是 什么 ? 
c. 2001 年 第 一 学 期 使 用 的 最 小 Section 号 是 什么 ? 
. 写 出 回答 下 列 问题 的 SQL 命令 : 
a. 2001 年 第 一 学 期 ，Section 2714 有 多 少 学 后 注册 ? 
b. 自 1993 年 以 来 哪些 教 职 工 已 经 获得 授课 资格 ? 列 出 教 职 工 的 ID ， 所 教授 的 课程 和 获 
得 授课 资格 的 日 期 。 
. 写 出 回答 下 列 问 题 的 SQL 命令 : 
a. 哪些 学 生 注 册 了 Patabase 和 Networking 课 程 ? (提示 : 使 用 各 个 班级 的 SECTION_ID， 
你 就 能 从 IS_REGISTERED 表 中 得 到 解答 。) 
b. 哪些 教师 既 不 能 教授 Syst Analysis 又 不 能 教授 Syst Design? 
. 写 出 回答 下 列 问题 的 SQL 命 令 : 
a. SECTION 表 中 包含 了 哪些 课程 ”一 次 列 出 一 门 课程 。 
b. 按 STUDENT_NAME 的 字母 顺序 列 出 所 有 的 学 生 。 
c. 列 出 2001 年 第 一 学 期 注册 了 每 门 课程 的 学 生 ， 按 他 们 注册 的 班级 分 组 。 . 
d. 显示 可 选 的 课程 。 按 课程 的 前 组 分 组 (ISM 是 所 显示 的 惟一 的 前 级 ， 但 是 在 大 学 里 还 
有 许多 其 他 的 前 组 ) 。 
问题 和 练习 10 ~ 19 要 基于 整个 松 谷 家 具 公 司 数 据 库 进 行 回 答 。 
10. 通过 增加 属性 QTY_ON_HAND 来 修改 PRODUCT_T 表 ， 该 属性 用 于 跟踪 已 完成 的 货物 
清单 。 该 字段 是 有 5 个 字符 的 整数 字段 ， 且 只 能 是 正 数 。 
11. 将 你 自己 选择 的 样本 数据 输入 到 PRODUCT_T 表 的 QTY_ON_HAND 中 。 通 过 把 一 个 产 
品 的 库存 更 新 为 10 000 个 ， 来 测试 问题 与 练习 10 中 所 作 的 修改 。 现 在 ， 再 一 次 把 产品 的 库存 修 
改 为 -10 个 来 进行 测试 。 如 果 你 没有 收 到 错误 信息 ， 成 功 进行 了 这 些 修改 ， 就 表明 在 问题 与 练 
习 10 中 没有 建立 合适 的 约束 。 
12. 向 ORDER_T 表 中 增加 一 个 订单 ， 为 订单 的 每 个 属性 包含 一 个 示例 值 。 
a. 首先 ， 看 一 下 CUSTOMER_T 表 中 的 数据 ， 为 任意 一 个 顾客 输入 订单 。 
b. 然后 ， 为 一 个 新 的 顾客 输入 订单 。 如 果 你 没有 在 CUSTOMER_ T 表 中 插入 这 个 新 顾 
客 的 信息 ， 那 么 输入 的 订单 数据 会 被 拒绝 。 如 果 没 有 顾客 的 信息 ， 那 么 参照 完整 性 
约束 将 会 阻止 你 输入 该 客户 的 订单 。 
13. a. 松 谷 家 具 公 司 有 多 少 加 工 中 心 ? 
b. 这 些 加 工 中 心 位 于 什么 地 方 ? 
14. 哪些 产品 的 材料 中 含有 橡木 (oak ) 
15. 显示 居住 在 加 利 柱 尼 开 或 华 这 他 的 大 客 ， 按 邮 政 编码 从 高 到 低 排序 
16. 确定 每 个 产品 系列 的 平均 标准 价格 。 
17. 列 出 那些 姓 以 “L” 开 头 的 员工 。 


~ 
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18. 哪些 员工 在 1999 年 被 雇佣 ? 

19. 对 于 每 个 被 订购 的 产品 ， 确 定 订购 的 总 量 。 列 出 最 受 欢迎 的 产品 和 最 不 受 欢迎 的 产品 。 
应 用 入 

1. 咨询 你 所 处 地 区 某 组 织 的 一 个 数据 库 管 理 员 。 在 采访 该 数据 库 管 理 员 时 ， 了 解 一 下 该 
组 目前 正在 使 用 的 一 个 应 用 程序 。 在 采访 中 要 主要 询问 以 下 问题 : 确定 终端 用 户 应 用 程序 的 
关系 ， 了 解 终端 用 户 对 SQL 应 熟悉 到 何 种 程度 。 例 如 ， 如 果 终 端 用户 要 使 用 SQL， 他 们 要 接受 
哪些 培训 ?他 们 在 工作 中 使 用 交互 式 的 SQL 吗 或 者 他 们 使 用 媒 入 式 的 SQL 吗 ? 

2. 再 一 次 采访 该 组 织 的 数据 库 管理 员 。 这 次 采访 的 重点 在 于 了 解 该 组 织 使 用 SQL 的 环境 。 
询问 所 使 用 的 SQL 的 版 本 ， 确 定 是 否 整个 组 织 都 使 用 了 相同 版 本 的 SQL? 如 果 使 用 了 不 同 版 本 
的 SQL， 探 讨 一 下 DBA 在 管理 数据 库 时 所 遇 到 的 困难 。 还 要 询问 一 下 组 织 中 使 用 了 哪些 专 有 的 

语言 ， 比 如 Oracle 的 PL*SQL。 了 解 一 下 不 同 部 门 所 使 用 的 版 本 的 可 能 差异 ， 探 讨 安装 不 同 版 
人 全 有 10 

3. 同 本 地 组 织 中 的 一 个 数据 库 开发 人 员 交 流 。 探 讨 在 他 的 工作 中 使 用 SQL 的 情况 。 开 发 人 
员 是 使 用 代码 生成 器 工具 有 具 还 是 自己 编写 所 有 的 SQL 代码 ? 开发 人 员 是 否 有 一 个 供 自己 支配 的 
CASE 工 具 ， 如 Designer 2000? 如 果 可 能 的 话 ， 请 开发 人 员 演 示 他 正在 使 用 的 CASE 工 具 。 
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2000 年 12 月 28 日 (包括 一 个 在 线 的 SQL3 引 擎 和 来 自 现实 数据 的 例子 )。 
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年 12 月 28 日 (关于 OCP 考 试 的 各 种 信息 ， 以 及 免费 的 测验 问题 示例 ，Oracle 站 点 )。 

SQL lnterpreter and Tutorial, http://www.sqlcourse.com/ ,2000 年 12 月 28 日 ( 带 有 实际 数据 
库 的 ANSI SQL 的 子 集 )。 
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项 目 案例 : 山 景 社区 医院 


利用 第 4 章 中 为 山 景 社 区 医院 建立 的 SQL 数据 模型 ， 回 答 下 列 项 目 问题 并 完成 项 目 练习 。 
项 目 问题 
1) 你 将 用 哪 一 个 版 本 的 SQL 来 完成 项 目 练习 ? 
2) 哪 一 个 CASE 工 具 可 以 用 来 完成 项 目 练习 ? 
项 目 练习 
1) 用 SQL 语句 为 在 前 几 章 构建 的 概念 数据 模型 建立 山 景 社区 医院 数据 库 。 你 可 利用 第 3 章 、 
第 4 章 、 第 $ 章 和 第 6 章 的 项 目 案例 中 所 提供 的 信息 ， 选 择 列 的 数据 类 型 、 长 度 和 索引 等 。 
2) 如 果 在 前 一 个 小 题 中 没有 建立 主键 和 外 键 ， 那 么 利用 SQL 语句 建立 主键 和 外 键 。 
3) 选择 已 建立 的 一 部 分 数据 库 ， 并 向 其 中 播 入 示例 数据 ， 例 如 ， 你 可 以 使 用 数据 库 中 医护 
人 员 、 诊 疗 中 心 以 及 病人 的 有 关 部 分 ， 也 可 以 利用 数据 库 中 与 药 厂 、 内 科 / 外 科 项 目 、 检 查 以 
及 病人 的 有 关 部 分 。 检 测 你 插入 的 数据 ， 并 回答 这 些 实际 的 数值 如 何 帮助 你 测试 数据 库 的 功 
能 。 
4) 编写 并 测试 基于 上 述 例子 数据 的 查询 。 编 写 如 下 查询 : 
a. 仅 从 一 张 表 中 选择 所 需 的 信息 。 
b. 计算 表 中 某 个 属性 的 府 集 值 。 
c. 尝试 使 用 其 他 的 诊 合 函数 如 MIN、MAX 和 AVG 等 。 





第 8 章 高 级 SQL 


8.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

“定义 下 列 关键 术语 : 联结 、 等 值 联结 、 白 然 联结 、 外 联结 、 相 关子 查询 、 用 户 自 定义 数 
据 类 型 、 持 久 化 存储 模块 《SQL PSM )、 触 发 器 、 畏 数 、 过 程 、 嵌 入 式 SQL 和 动态 SQL。 

“使 用 SQL 命令 编写 对 单 玫 和 多 表 的 查询 。 

“理解 -种 类 型 的 联结 命令 ， 并 能 够 使 用 SQL 语句 编写 这 些 联结 命令 。 

“ 编写 非 相关 和 相关 子 查询 ， 理 解 其 使 用 场合 。 

“使 用 SQL 建立 参照 完整 性 。 

“理解 数据 库 触发 器 和 存储 过 程 的 使 用 方法 。 

“对 SQL-99 标 准 进 行 过 论 并 解释 它 对 SQL-92 进 行 增强 和 扩展 的 部 分 。 


8.2 引言 


在 上 一 章 中 介绍 了 SQL， 并 探讨 了 SQL 在 查询 单 张 表 时 的 作用 。 但 是 ， 只 有 存储 并 操作 许 
多 关联 实体 的 数据 对 象 时 ， 关 系 模 型 才 真 正 发 挥 出 它 的 优势 。 要 想 充分 利用 这 种 优势 ， 必 须 建 
立 表 之 阅 的 关系 ， 则 时 构造 从 多 个 表 中 得 到 数据 的 查询 。 本 章 将 详细 介绍 这 种 多 表 查 询 。 从 多 
个 表 中 得 到 查询 结果 的 方法 有 很 多 ， 包 括 使 用 子 查询 、 内 联结 和 外 联结 以 及 并 联结 等 。 

在 掌握 基本 的 SQL 语法 之 后 ， 应 理解 如 何在 创建 应 用 时 使 用 SQL。 触 发 器 是 一 小 段 包含 
SQL 命令 的 代码 模块 ， 当 预先 设 定 的 条 件 满 足 时 ， 触 发 器 将 自动 执行 。 过 程 也 是 一 个 类 似 的 代 
码 模 块 ， 但 它 必 须 被 显 式 调 用 后 才能 执行 。SQL 命 令 经 常 伐 入 到 用 宿主 语言 (如 C 和 Java) 编 
号 的 模块 中 。 动 态 SQL 可 以 在 运行 中 创建 SQL 命令 ， 根 据 需要 插 人 参数 值 ， 是 Web 应 用 所 必需 
的 。 本 竟 通 过 -- 些 实例 对 以 上 内 容 作 了 简要 介绍 。 同 时 本 章 还 介绍 了 SQL-99 中 对 SQL 进行 增 
强 和 扩展 的 一些 内 容 。 

学 完 本 章 后 ， 读 者 应 对 SQL 有 比较 全 面 的 了 解 ， 并 掌握 一 些 常 见 的 使 用 方法 。SQL 还 有 许 
多 应 用 于 特殊 情况 下 的 附加 特性 ， 这 些 特 性 不 是 SQL 的 基本 特性 ， 有 兴趣 的 读者 可 以 参阅 一 些 
专门 讲解 SQL 的 书籍 。 利 用 本 章 所 讲 的 语法 进行 实践 ， 学 生 可 以 顺利 地 掌握 SQL 。 


8.3 处 理 多 表 


我 们 已 经 介绍 了 SQL 在 单 表 操作 中 的 用 途 ， 利 用 SQL 对 多 表 进 行 操作 的 方法 是 类 似 的 。 
RDBMS 只 有 在 操纵 多 张 表 时 才能 完全 展现 出 它 的 功能 。 如 果 多 个 表 之 间 存 在 联系 ， 那 么 它们 
可 以 通过 查询 链接 起 来 。 回 忆 第 5 章 中 讲 过 ， 在 需要 建立 联系 时 ， 通 过 包含 每 个 表 的 一 个 公共 
列 (也 可 能 是 多 个 公共 的 列 ) 来 建立 联系 。 这 常常 通过 建立 主键 -外 键 联系 来 实现 ;外 键 是 对 
男 一 张 表 中 主键 的 引用 ， 它 们 具有 相同 的 域 。 两 张 表 之 间 的 联系 可 以 通过 查找 两 个 表 公共 列 的 
相同 值 来 建立 。 例 如 在 图 7-3 中 ， Order_t 表 中 的 Customer_ID 属 性 和 Customer_t 表 中 的 
Customer_ID 是 相对 应 的 。 比 较 这 些 列 和 它们 的 值 ， 可 以 发 现 Contemporary Casuals 发 出 了 订单 
#1001 和 #1010， 这 是 因为 Contemporary Casuals 的 Customer_ID 是 1， 而 Order_t 显 示 Order_ID 为 
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1001 和 1010 的 订单 是 由 Customer_ID 为 ! 的 人 发 出 的 。 在 一 个 关系 系统 中 ， 几 个 相 联 系 表 的 数据 
合并 成 了 一 个 结果 表 或 视图 ， 然 后 显示 出 来 ， 或 作为 表单 和 报表 定义 的 输入 。 

在 不 同类 型 的 关系 系统 中 ， 链 接 相关 联 的 表 的 方法 可 能 是 不 同 的 。 在 SQL 中 ，SELECT 命 令 
中 的 WHERE 子 句 也 可 以 用 于 多 表 操 作 。 事 实 上 ， 在 一 个 SELECT 命令 中 可 以 引用 两 张 表 、 三 张 
表 或 更 多 的 表 。 下 面 将 要 介绍 ， 有 两 种 不 同 的 使 用 SELECT 命令 的 方法 可 以 合并 多 张 表 的 数据 。 

最 常用 的 方法 是 使 用 关系 操作 ， 该 操作 从 两 张 或 多 张 表 提 取 数 据 到 一 个 结果 表 中 ， 该 过 程 
称 为 联结 (join )。SQL 通 过 WHERE 子 名 匹配 多 个 表 的 公共 列 ， 来 隐 含 地 实现 多 个 表 的 联结 。 
如 果 有 两 张 表 ， 一 张 表 中 有 一 个 和 另 一 张 表 中 对 应 列 有 同样 值 域 的 列 ， 则 这 两 张 表 可 以 建立 联 
结 。 联 结 操作 的 结果 是 一 张 单 表 ， 其 中 包括 了 表 中 所 有 被 选择 的 列 。 联 结 操作 返回 的 行 都 由 参 
加 联结 的 表 中 对 应 行 的 数据 组 成 ， 这 些 对 应 行 上 的 公共 列 的 值 相 匹 配 。 

在 编写 联结 条 件 时 有 一 条 重要 的 规则 : 对 每 一 对 联结 的 表 ， 都 必须 在 一 个 WHERE 子 句 中 
编制 一 个 联结 条 件 。 因 此 ， 如 果 对 两 张 表 进 行 组 合 ， 必 须 有 一 个 条 件 ; 而 如 果 对 三 张 表 进行 组 
合 (A、B 和 C)， 则 必须 有 两 个 条 件 ， 因 为 存在 两 对 表 (A-B、B-C)， 其 他 情况 依 此 类 推 。 

在 关系 数据 库 查 询 中 ,可 能 会 存在 多 种 联结 类 型 ， 每 个 SQL 实现 可 能 只 支持 其 中 的 -一 部 分 。 
本 章 讲 述 4 种 联结 类 型 : 等 值 联结 、 自 然 联 结 、 外 联结 和 并 联结 。 

8.3.1 等 值 联 结 

等 值 联结 (equi-join) 的 条 件 是 两 张 表 中 公共 列 的 值 相等 。 例 如 ， 如 果 想 知道 下 订单 的 顾 
客 姓名 ， 和 而 这 些 信息 存储 在 CUSTOMER_T 和 ORDER_T 两 张 表 中 注意， 本章 的 学 习 基于 
Oracle 数 据 库 ， 所 以 使 用 大 写字 母 来 表示 表 和 属性 名 )。 首 先 对 顾客 和 他 们 的 订单 进行 匹配 ， 
然后 根据 问题 选择 相关 的 信息 ， 最 后 将 顾客 姓名 和 订单 号 显示 在 一 张 表 中 。 

查询 1 找 出 所 有 已 经 下 订单 的 顾客 姓名 。 


SELECT CUSTOMER T.CUSTOMER ID, ORDER T.CUSTOMER ID， 
CUSTOMER NAME, ORDER_ID 
FROM CUSTOMER T, ORDER_T 

WHERE CUSTOMER T.CUSTOMER ID = ORDER T.CUSTOMER ID; 


结果 : 
CUSTOMER_ID CUSTOMER ID CUSTOMER NAME ORDER_1D 
1 1 Contemporary Casuals 1001 
8 8 California Classics 1002 
15 15 Mountain Scenes 1003 
5 5 Impressions 1004 
3 3 Home Furnishings 1005 
2 2 Value Furniture 1006 
11 11 American Euro Lifestyles 1007 
12 12 Battle Creek Furniture 1008 
4 4 Eastern Furniture 1009 
1 1 Contemporary Casuals 1010 


10 rows selected. 


CUSTOMER_ID 列 的 值 是 有 重复 的 ， 因 为 两 张 表 中 均 包含 该 列 ， 说 明 所 有 的 客户 ID 号 均 被 
匹配 ， 匹 配 的 结果 是 每 行 中 有 一 个 不 重复 的 订单 号 。WHERE 子 名 决 不 能 忽略 ， 否 则 查询 结果 
将 会 返回 所 有 顾客 和 订单 的 组 合 ， 即 此 两 表 的 笛 卡 儿 积 。 币 卡 儿 积 返 回 的 行 数 等 于 两 张 表 中 行 
数 的 乘积 10 个 订单 x 15 个 客户 = 150 行 )， 而 这 个 结果 没有 任何 实际 意义。 

同样 ， 为 了 说 明 Oracle SQL 和 Access SQL 的 区 别 ， 下 面 给 出 了 Access SQL 产 生 的 查询 。 








查询 2 ” 找 出 所 有 已 经 下 订单 的 顾客 名 。 

SELECT Customer t.Customer ID, Order t.Customer ID, 

Customer t.Customer name, Order t.Order _ ID 

FROM Customer t INNER JOIN Order t ON Customer t.Customer ID = 
Order t.Customer ID; 


结果 : 与 上 面 查询 的 结果 相间 。 

在 Customer_t 和 和 Order_t 表 之 间 的 这 种 联结 称 为 内 联结 (inner join )。 在 这 里 ，WHERE 子 句 
被 子 句 ON Customer_t.Customer_ID = Order_tCustomer_ ID 代替 ;INNER JOIN-ON 是 SQL-92 的 
语法 ， 这 种 写法 将 越 来 越 普 及 。 注 意 ， 联 结语 法 被 移 区 FROM 子 句 ， 使 WHERE 子 句 仅 起 过 滤 
器 的 作用 。 

8.3.2 自然 联结 

自然 联结 (natural join ) 与 等 值 联 结 是 相同 的 ， 惟 一 的 区 别 是 ， 在 使 用 两 张 表 的 同名 列 进 
行 联结 操作 后 ， 重 复 列 之 一 不 出 现在 联结 结果 中 。 自 然 联结 是 联结 操作 中 最 常用 的 一 种 。 如 通 
过 SQL 命令 查询 得 到 客户 名 和 订单 号 ， 略 去 了 一 个 CUSTOMER_ID。 注意 ，CUSTOMER_ID 
列 必 须 是 被 ( 表 名 ) 限定 的 ， 因 为 它 有 二 义 性 ， 即 CUSTOMER_ID 同 时 存在 于 CUSTOMER_T 
表 和 ORDER_T 表 中 ， 所 以 必须 告诉 SQL *Plus 从 哪 张 表 中 获得 CUSTOMER_ID，。 

查询 3 查询 下 订单 的 客户 的 客户 姓名 和 订单 号 。 

SELECT CUSTOMER T.CUSTOMER ID， CUSTOMER NAME, ORDER_ID 


FROM CUSTOMER T , ORDER T 
WHERE CUSTOMER T.CUSTOMER ID = ORDER T.CUSTOMER ID; 


广 意 ，FROM 子 句 中 表 名 的 顺序 并 不 重要 。DBMS 的 查询 优化 器 将 决定 表 的 处 理 顺 序 。 在 
相同 列 上 是 否 存在 索引 将 影响 表 的 处 理 顺 序 ， 哪 张 表 处 于 1:M 联 系 的 ! 方 或 M 方 也 将 影响 表 的 处 
理 顺 序 。 如 果 一 个 查询 所 需 的 时 间 与 FROM 子 句 中 的 表 的 排列 顺序 显著 相关 ， 即 其 查询 效率 需 
要 用 户 手工 干预 ， 则 说 明 该 DBMS 不 具备 一 个 很 好 的 查询 优化 器 。 

8.3.3 外 联结 

在 对 两 张 表 作 联 结 操作 时 ， 经 常 可 以 发 现 一 张 表 中 的 某 一 行 在 另 一 张 表 中 没有 对 应 行 。 例 
如 , 在 表 CUSTOMER_T 中 的 几 个 CUSTOMER_ID 值 在 ORDER_T 中 并 设 有 出 现 (如 图 7-3 所 示 )。 
可 以 猜想 这 是 因为 那些 客户 直至 2000 年 10 月 21 日 还 没有 发 出 订单 ， 也 可 能 是 因为 他 们 的 订单 没 
有 包括 在 这 个 简单 的 ORDER_T 例 子 表 中 。 所 以 ， 上 述 等 值 联结 和 自然 联结 的 结果 没有 包含 
CUSTOMER_T 中 所 有 的 客户 名 。 

企业 可 能 希望 确定 那些 还 没有 发 出 订单 的 汶 在 客户 ， 希 望 与 这 些 客户 联系 并 获得 新 订单 ， 
或 者 想 要 分 析 这 些 客户 从 而 找 出 没有 他 们 没有 下 订单 的 原因 。 使 用 外 联结 (outer join) 可 以 产 
生 这 些 信息 : 在 相同 列 上 没有 对 应 值 的 行 也 可 以 包含 在 结果 表 中 。 在 表 之 间 找 不 到 对 应 值 时 ， 
在 该 列 上 的 位 置 上 以 空 值 填充 。 

大 多 数 广 商 的 RDBMS 产 品 都 提供 了 外 联结 功能 ， 但 不 同 厂商 提供 的 用 于 实现 外 联结 操作 
的 语法 却 不 尽 相同 。 下 面 的 例子 所 使 用 的 是 ANSI 标 准 语法 。 如 果 某 种 DBMS 中 没有 明确 定义 
外 联结 ， 可 以 使 用 UNION 和 NOT EXIST (将 在 本 章 后 面 的 部 分 讨论 ) 来 实现 外 联结 操作 。 下 
面 是 一 个 外 联结 的 例子 。 

查询 4 列 出 CUSTOMER 表 中 所 有 自 客 的 姓名 ，ID 号 和 订单 号 。 包 括 没 有 下 订单 的 顾客 的 
1D 号 和 姓名 。 


SELECT CUSTOMER T.CUSTOMER ID, CUSTOMER_NAME, ORDER ID 
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FROM CUSTOMER T LEFT OUTER JOIN ORDER T 
WHERE CUSTOMER T.CUSTOMER ID = ORDER T.CUSTOMER ID; 

上 上 面 使 用 了 LEFT OUTER JOIN 语法 , 这 是 因为 CUSTOMER_T 表 被 放 在 联结 关键 字 的 左边 ， 
而 期 望 的 结果 应 包括 该 表 的 所 有 内 容 ， 所 以 无 论 在 ORDER_T 表 中 是 否 有 订单 与 之 匹配 ， 表 
CUSTOMER_T 的 所 有 内 容 都 将 出 现在 结果 表 中 。 如 果 将 表 的 排列 顺序 倒置 ， 那 么 使 用 RIGHT 
OUT JOIN 可 以 保持 查询 结果 不 变 。 用 户 也 可 以 使 用 FULL OUTER JOIN 语法 ， 在 这 种 情况 下 ， 
匹配 后 返回 所 有 的 行 ， 包 括 那些 在 另 一 张 表 中 没有 匹配 值 的 行 。INNER JOIN 比 OUTER JOIN 
更 常用 ， 因 为 外 联结 只 在 用 户 认为 使 用 内 联结 会 遗漏 必要 信息 的 情况 下 使 用 。 

还 应 注意 的 是 ，OUTER JOIN 难以 应 用 在 超过 两 张 表 的 情况 下 ， 返 回 的 结果 会 因 DBMS 的 
不 同 而 不 同 。 所 以 ， 如 果 不 清楚 所 用 的 DBMS 是 如 何 对 外 联结 命令 进行 解释 的 ， 应 该 对 涉及 两 
张 以 上 表 的 外 联结 命令 语法 进行 测试 。 

同样 ， 在 外 联结 产生 的 结果 表 中 ， 可 能 以 NULL 值 来 表示 在 第 二 张 表 中 没有 匹配 到 的 值 。 
如 果 表 本 身 可 以 使 用 NULL 作 为 数据 值 ， 那 么 用 户 就 无 法 分 辨 这 些 空 值 是 原 有 的 值 还 是 未 匹配 
成 功 而 填充 的 空 值 ， 除 非 在 基 表 或 视图 上 运行 另 一 个 查询 来 检验 空 值 。 而 且 ， 在 运行 OUTER 
JOIN 所 得 到 的 结果 表 中 ， 被 定义 为 NOT NULL 的 列 可 能 被 赋予 一 个 空 值 。 





结果 : 
CUSTOMER_ID CUSTOMER NAME ORDER_IB 
1 Contemporary Casuals 1001 
1 Contemporary Casuals 1010 
2 Value Furniture 1006 
3 Home Furnishings 1005 
4 Eastern Furniture 1009 
5 Impressions 1004 
6 Furniture Gallery 
7 Period Furnishings 
8 California Classics 1002 
9 M & H Casual Furniture 
10 Seminole Interiors 
11 American Euro Lifestyles 1007 
12 Battle Creek Furniture 1008 
13 Heritage Furnishings 
14 Kaneohe Homes 
15 Mountain Scenes 1003 


16 rows selected. 


使 用 外 联结 的 优点 是 不 会 产生 信息 丢失 。 在 上 面 的 表 中 ， 返 回 了 所 有 的 客户 名 ， 无 论 这 些 
客户 是 否 下 了 订单 。 运 行 RIGHT OUT JOIN 会 返回 所 有 订单 〈 既 然 参 照 完整 性 要 求 每 个 订单 都 
必须 与 一 个 合法 的 客户 ID 相关 联 ， 则 使 用 右 外 联结 时 假定 参照 完整 性 已 经 被 强制 执行 )， 

查询 5 列 出 所 有 与 ORDER 表 中 出 现 的 订单 相关 的 顾客 名 、ID 号 和 订单 号 。 即 使 某 些 订单 
没有 顾客 名 和 顾客 号 与 之 对 应 也 包括 在 内 。 


“SELECT CUSTOMER_T.CUSTOMER_ID， CUSTOMER NAME, ORDER_ID 
FROM CUSTOMER_T RIGHT OUTER JOIN ORDER T ON 
CUSTOMER_T.CUSTOMER ID = ORDER_T。 CUSTOMER ID; 


8.3.4 并 联结 
仁 SQL-99 中 还 可 以 使 用 UNION JOIN (并 联结 )， 但 这 尚未 在 所 有 DBMS 产 品 中 实现 。 
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UNION JOIN 操作 的 结果 返回 一 张 结果 表 ， 该 表 中 包含 了 参与 联结 的 每 张 表 的 所 有 数据 。 结 果 
表 将 包含 参与 联结 的 表 的 所 有 列 ， 以 及 所 有 表 中 每 一 行 数据 所 组 成 的 记录 。 因 此 ， 
CUSTOMER_T 表 (15 个 顾客 ，6 个 属性 ) 和 ORDER_T 表 (10 张 订单 ，3 个 属性 ) 的 UNION 
JOIN 操 作 返 回 的 结果 表 中 将 有 25 行 和 9 列 。 假 定 每 个 原始 表 中 都 不 包含 空 值 ， 则 结果 表 中 每 个 
顾客 行将 包括 3 个 可 以 赋予 空 值 的 属性 ， 而 每 个 订单 行将 包括 6 个 可 以 赋予 空 值 的 属性 。 注 意 不 
要 将 UNION JOIN 命令 和 UNION 命 令 混 诺 ， 后 者 用 于 联结 多 个 SELECT 语句 ， 其 具体 内 容 将 在 
本 章 后 面部 分 讲述 。 


CUSTOMER_ID CUSTOMER_NAME CUSTOMER_ADDRESS CITY ST POSTAL_CODE 














2 Value Furniture 15145 S.W. 17th St. Plano TX 75094 
2 Value Furniture 15145 S.W. 17th St. Plano TX 75094 
2 Value Furniture 15145 S.W. 17th St. Plano TX 75094 
ORDER ID ORDER-DAT QUANTITY PRODUCT NAME UNIT_PRICE (QUANTITY*UNIT_PRICE) 
1006 24-OCT-00 1 Entertainment Center 650 650 
1006 24-OCT-00 2 Writer's Desk 325 650 
1006 24-OCT-00 2 Dining Table 800 1600 








图 8-] 对 四 张 表 进行 联结 操作 的 结果 ( 为 便于 阅读 ， 排 版 形式 有 所 改变 ) 


8.3.5 例子 : 涉及 4 张 表 的 多 重 联结 

关系 模型 功能 的 强 弱 在 很 大 程度 上 取决 于 它 处 理 数 据 库 中 对 象 之 间 关 系 的 能 力 。 设 计 一 个 
数据 库 时 ， 使 每 个 对 象 的 数据 分 别 存储 在 不 间 的 表 中 ， 可 以 简化 维护 和 数据 完整 性 。 可 通过 表 
的 联结 操作 使 对 象 彼此 关联 ， 可 以 获得 关键 的 业务 信息 。 第 7 章 和 第 8 章 中 的 例子 都 比较 简单 ， 
是 为 了 让 读者 对 SQL 有 基本 的 了 解 而 构造 的 ; 但 是 读者 必须 认识 到 ， 这 些 命令 能 够 构造 出 更 加 
复杂 的 查询 ， 从 而 为 各 种 报表 和 处 理 提 供 信息 。 

下 面 是 一 个 涉及 4 张 表 的 联结 查询 的 例子 。 这 个 查询 产生 的 结果 表 为 #1006 订 单 创建 发 货 单 
提供 所 需 的 信息 。 在 此 过 程 中 需要 顾客 信息 、 订 单 和 订单 线 信息 以 及 产品 信息 ， 所 以 需要 联结 
4 张 表 。 

查询 6 组 合 所 有 必要 信息 ， 为 订单 #1006 创 建 一 张 发 货 单 。 

SELECT CUSTOMER T.CUSTOMER ID, CUSTOMER NAME, CUSTOMER ADDRESS, CITY, STATE, 

POSTAL_CODE, ORDER T.ORDER_ID, ORDER DATE, QUANTITY, PRODUCT NAME, UNIT PRICE, 

(QUANTITY*UNIT PRICE) 

FROM CUSTOMER _T, ORDER T, ORDER LINE T, PRODUCT 了 

WHERE CUSTOMER T. CUSTOMER ID=ORDER T. CUSTOMER ID 
AND ORDER T.ORDER_ID = ORDER LINE T.ORDER_ID 


AND ORDER LINE T.PRODUCT ID = PRODUCT T.PRODUCT ID 
AND ORDER T.ORDER ID = 1006; 


查询 的 结果 如 图 8-1 所 示 。 记 住 ， 既 然 要 联结 4 张 表 ， 就 应 该 有 3 个 列 联结 条 件 。 
8.3.6 子 查询 

对 两 张 表 进行 联结 的 基本 方法 有 两 种 ， 前 面 的 SQL 例 子 描述 了 其 中 的 一 个 方法 ， 即 联结 技 
术 。SQL 还 提供 了 子 查 询 技 术 ， 即 在 查询 的 WHERE 和 HAVING 子 句 中 嵌入 一 个 内 部 查询 
(SELECT、FROM、WHERE)。 外 部 查询 的 查询 条 件 中 某 些 值 由 内 部 查询 提供 。 这 种 查询 被 称 
为 子 查 询 或 幅 套 子 查询 ， 而 且 可 以 由 套 多 层 。 

有 了 时候， 使 用 联结 操作 和 子 查 询 技术 可 以 得 到 相间 的 结果 ， 不 同 的 人 对 这 两 种 技术 有 自己 
的 偏好 。 但 在 其 他 时 候 ， 只 能 使 用 联结 或 只 能 使 用 子 查 询 才能 实现 相应 的 查询 。 要 从 多 个 联系 
中 提取 数据 并 显示 ， 并 且 联 系 之 间 不 必 嵌 罕 的 时 候 ， 使 用 联结 技术 更 方便 。 比 较 返 回 同样 结果 
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的 两 个 查询 :查询 发 出 #1008 订 单 的 顾客 姓名 和 地 址 。 首 先 ， 我 们 使 用 联结 操作 。 
查询 7 查询 发 出 #1008 订 单 的 顾客 姓名 和 地 址 。 
SELECT CUSTOMER NAME, CUSTOMER ADDRESS, CITY, STATE, POSTAL CODE 
FROM CUSTOMER T, ORDER TT 
WHERE CUSTOMER _T.CUSTOMER ID=ORDER T.CUSTOMER ID AND 
ORDER ID = 1008; 
使 用 子 查 询 技 术 得 到 的 查询 与 前 一 查询 是 等 价 的 。 
查询 8 ”查询 发 出 #1008 订 单 的 顾客 姓名 和 地 址 。 
SELECT CUSTOMER NAME, CUSTOMER ADDRESS, CITY, STATE, POSTAL CODE 
FROM CUSTOMER T 
WHERE CUSTOMER T.CUSTOMER ID = 
(SELECT ORDER T.CUSTOMER ID 


FROM ORDER 7 
WHERE ORDER ID = 1008); 


注意 ， 在 圆 括 号 中 的 子 查询 和 前 面 学 过 的 SQL 查询 在 形式 上 是 相同 的 ， 即 也 可 以 把 它 单 独 
取出 来 形成 一 个 独立 的 查询 。 因 为 在 这 个 查询 中 只 需要 显示 从 外 部 查询 中 的 表 中 得 到 的 数据 ， 
所 以 可 以 使 用 子 查询 的 方法 。ORDER_ID 的 值 没有 出 现在 结果 中 一 一 它 作为 外 部 查询 的 选择 条 
件 。 如 果 要 企 最 终 的 结果 中 显示 子 查询 的 结果 ， 只 能 使 用 联结 技术 ， 因 为 子 查 询 得 到 的 结果 不 
会 包含 在 最 终结 果 中 。 

可 以 预先 知道 在 前 面 的 子 查询 中 最 多 返回 一 个 值 ， 即 与 ORDER_ID 为 #1008 相 关 的 
CUSIOMER_ID。 如 果 不 存 在 这 个 ID 值 ， 则 子 查询 的 结果 将 为 空 。 在 子 查询 中 使 用 关键 字 IN 
可 以 返回 值 的 列表 (无 论 是 0 条 、1 条 还 是 多 条 记录 )。 例 如 ， 可 以 查询 已 经 下 订单 的 顾客 。 以 
下 是 相应 的 查询 表达 式 。 

查询 9 哪些 顾客 下 了 订单 ? 

SELECT CUSTOMER NAME 

FROM CUSTOMER T 
WHERE CUSTOMER ID IN 


(SELECT DISTINCT CUSTOMER ID 
FROM ORDER T); 


查询 结果 如 下 。 因 为 并 不 关心 一 个 顾客 总 共 下 了 多 少 份 订单 ， 只 关心 他 是 否 下 了 订单 ， 所 
以 在 子 查询 中 使 用 了 DISTINCT 关 键 字 。 对 于 每 一 个 ORDER_T 表 中 出 现 的 顾客 号 ， 在 
CUSTOMER_T 中 查找 其 对 应 的 顾客 名 并 返回 (我们 将 在 图 8-2a 中 再 次 讨论 这 个 查询 )。 

结果 : 

CUSTOMER NAME 

Contemporary Casuals 

Value Furniture 

Home Furnishings 

Eastern Furniture 

Impressions 

California Classics 

American Euro Lifestyles 

Battle Creek Furniture 

Mountain Scenes 


9 rows selected. 
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限定 符 NOT、ANY 和 ALL 可 用 在 IN 之 前 或 者 与 逻辑 操作 符 (如 = 、> 和 <) 结合 使 用 。 因 
为 IN 可 以 利用 子 查 询 返 回 的 0 个 、1 个 或 多 个 值 ， 许 多 程序 员 在 所 有 查询 中 也 常常 用 IN 来 赫 代 
“= "”， 即 使 在 “= ”操作 符 也 能 适用 的 情况 下 也 是 如 此 。 下 一个 例子 显示 NOT 的 使 用 方法 ， 这 
个 例子 还 说 明了 人 在 子 查 询 中 也 能 使 用 联结 操作 : 

查询 10 查询 没有 订购 计算 机 桌 的 顾客 名 。 

SELECT CUSTOMER NAME 

FROM CUSTOMER T 
WHERE CUSTOMER ID NOT IN 
(SELECT CUSTONMER _ID 
FROM ORDER T,ORDER LINT T,PRODUCT T 
WHERE ORDER T.ORDER ID = 

ORDER LINE T.ORDER ID AND 
ORDER_LINE T.PRODUCT ID = 

PRODUCT T.PRODUCT_ID 

AND PRODUCT NAME ='Computer Desk'); 


结果 : 

CUSTOMER NAME 

Value Furniture 

Home Furnishings 
Eastern Furniture 
Furniture Gallery 
Period Funiture 

MH Casual Furniture 
Seminole Interiors 
American Euro Lifestyles 
Heritage Furnishings 
Kaneohe Homes 


10 rows selected. 


结果 显示 还 有 10 个 客户 设 有 订购 计算 机 桌 。 内 层 子 查询 返回 了 一 个 已 经 订购 计算 机 桌 的 顾 
客 列表 。 外 部 查询 列 出 了 役 有 在 子 查询 返回 值 中 列 出 的 顾客 姓名 。 

与 使 用 子 查询 有 关 的 另外 两 个 条 件 是 EXISTS 和 NOT EXJSTS。 这 些 关 键 字 在 SQL 查询 中 
IN 所 在 的 位 置 出 现 , 即 子 查询 开始 之 前 出 现 。 如 果子 查询 返回 的 中 间 结 果 表 中 包含 一 行 或 多 行 ， 
则 EXISTS 为 TRUE， 如 果 返 回 结果 中 没有 任何 行 ， 则 RXISTS 为 FALSE。 相 反 ，NOT EXISTS 
任 返 回 结果 为 空 时 取 TRUE ， 而 在 返回 结果 有 -- 行 或 多 行 时 则 取 FALSE。 考 虑 下 面 的 SQL 命令 ， 
其 中 包括 了 EXISTS 。 

查询 11 找 出 所 有 符合 以 下 要 求 的 订单 号 ， 其 中 至 少 包 含 一 种 使 用 天 然 自 蜡 水 (Natural 
Ash) 制造 的 家 县 。 

SELECT DISTINCT ORDER ID FROM ORDER_LINE T 

WHERE EXISTS 

(SELECT * 
FROM PRODUCT T 


WHERE PRODUCT ID = ORDER_LINE T.PRODUCT ID 
AND PRODUCT FINISH = ‘Natural Rsh' ); 


子 查 询 检 查 订 单线 上 的 产品 是 否 是 由 天 然 白 蜡 木 制造 的 。 主 查询 选择 出 所 有 包含 使 用 天 然 
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白蜡 木 制造 的 家 具 的 订单 号 。 共 有 7 张 符合 条 件 的 订单 ， 如 下 面 的 查询 结果 所 示 (在 图 8-2b 中 
将 进一步 讨论 这 个 查询 )。 
结果 : 
ORDER_ID 
1001 
1002 
1003 
1006 
1007 
1008 
1009 


7 rows selected. 


在 一 个 子 查询 中 使 用 EXISTS 或 NOT EXISTS 时 . 子 查询 的 选择 列表 通常 使 用 “SELECT *” 
表示 选择 所 有 列 ， 因 为 子 查询 返回 哪些 列 并 不 重要 。 子 查询 的 日 的 是 检查 是 否 有 一 些 行 满足 条 
件 ， 而 不 是 返回 特定 列 的 值 。 外 部 查询 确定 要 显示 的 列 。EXISTS 子 查询 …- 般 是 相关 子 查 询 
(将 在 随后 讨论 )。 如 果 不 存 在 满足 子 查询 的 行 ， 包含 NOT EXISTS 关 键 字 的 查询 将 返回 一 个 结 
果 表 。 

总 乙 ， 当 限定 条 件 是 嵌 套 的 或 很 容易 用 藤 套 方法 实现 时 ， 应 该 使 用 了 查询 方法 。 
SQL#Plus 允 许 子 查询 返回 多 列 ， 但 大 多 数 系统 只 允许 在 子 查询 中 的 某 一 特定 你 与 外 部 查询 的 
“ 记 之 间 建 立 联结 。 但 是 与 EXISTS 一 起 使 用 的 子 查询 例外 。 最 终 的 结果 表 中 仅 显示 外 部 查 
询 中 表 的 数据 。 典 型 情况 下 最 多 支持 16 层 幅 僵 。 查 询 按 由 内 到 外 的 次 序 执行 ， 但 另 一 种 子 查 
询 一 一 相关 子 查 询 一 一 是 由 外 到 内 处 理 的 。 

8.3.7 相关 子 查 询 

在 第 一 个 子 查 询 的 例子 中 ， 首 先 必须 确认 内 部 查询 已 经 完成 ， 才 能 进行 外 部 查询 。 也 就 是 
说 ， 内 部 查询 的 结果 用 来 限定 外 部 查询 的 处 理 。 然 而 ,在 相关 子 查 询 (correlated subquery ) 中 ， 
外 部 查询 的 结果 决定 内 部 查询 的 处 理 。 也 就 是 说 ， 对 于 引用 外 部 查询 中 每 一 行 的 内 部 查询 在 某 
种 程度 上 都 是 不 同 的 。 在 这 种 情况 下 ， 内 部 查询 必须 根据 每 个 外 部 查询 的 行进 行 计算 。 而 在 前 
面 的 例子 中 ， 内 部 查询 只 需 计算 一 次 ， 即 可 提供 所 有 外 部 查询 中 要 处 理 的 行 。 图 8-2a 和 图 8-2b 
描述 了 在 前 面 各 节 中 子 查询 的 每 个 例子 的 不 同 处 理 顺 序 。 

下 面 的 查询 中 列 出 了 PRODUCT_T 中 产品 单价 最 高 的 产品 信息 。 

查询 12 列 出 单价 最 高 的 产品 信息 。 

SELECT PRODUCT NAME, PRODUCT FINISH, UNIT PRICE 

FROM PRODUCT T PA 
WHERE UNIT PRICE > ALL 
{SELECT UNIT PRICE FROM PRODUCT T PB 
WHERE PB.PRODUCT ID! = PA.PRODUCT ID); 


下 面 是 结果 ， 即 单价 最 高 的 产品 是 餐桌 。 


结果 : 

PRODUCT NAME PRODUCT FINISH UNIT PRICE 
td 
Dining Table Natural Ash 800 


研究 这 个 SQL 语句 的 逻辑 : 对 于 每 个 产品 ， 子 查询 都 执行 一 次 以 确认 没有 其 他 产品 具有 更 
高 的 单价 。 注 意 ， 这 需要 将 一 个 表 和 它 自身 相 比较 。 为 了 完成 这 项 工作 ， 在 这 里 给 表 起 了 两 个 
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别名 PA 和 PB。 首 先 考虑 PRODUCT_ID 为 1 的 产品 。 子 查询 执行 时 ， 将 返回 除外 部 查询 正 孝 
察 的 那个 产品 以 外 的 每 个 产品 的 单价 。 然 后 ， 外 部 查询 会 检查 正 考察 产 品 的 单价 是 否 比 子 查询 
返回 的 所 有 产品 的 单价 都 高 。 如 果 是 ， 返 回 该 产品 作为 查询 结果 。 如 果 不 是 ， 再 考虑 外 部 查询 
的 下 一 个 值 ， 而 内 部 查询 将 会 又 返回 除 当 前 正 考 虑 的 产品 以 外 的 所 有 产品 的 单价 列表 。 当 外 部 
查询 的 目标 值 变 化 时 ， 内 部 查询 返回 的 列表 也 会 发 生变 化 。 这 就 构成 了 一 个 相关 子 查询 。 请 读 
者 思考 ， 是 否 存 在 一 组 特别 的 单价 ， 使 得 这 个 查询 不 能 产生 期 望 的 结果 ? 
8.3.8 使 用 导出 表 

子 查询 并 不 仅 限 于 在 WHERE 子 句 中 使 用 ， 也 可 以 出 现在 FROM 子 句 中 ， 以 创建 一 个 在 查 
询 中 应 用 的 临时 导出 表 。 创 建 一 个 包含 聚合 值 (如 MAX、AVG 或 MIN) 的 导出 表 ， 就 可 以 在 
WHERE 子 句 中 使 用 察 合 。 下 面 的 查询 列 出 超过 半 均 标准 价格 的 那些 家 具 。 

SELECT CUSTOMER_NAME 


FROM CUSTOMER T 
WHERE CUSTOMER_ID IN 





(SELECT DISTINCT CUSTOMER_ID 
FROM ORDER_T); 





.这 先 处 理子 存 谢 《 方 碟 中 的 部 分 ) 并 创建 :个 中 间 结 果 去 : 


CUSTOMER_ID 


一 一 
一 NDDmgoD 一 


12 
4 
9 rows selected. 


iD 


- 外 部 查询 输出 包含 在 中 间 结 果 表 中 所 需要 的 伍 个 里 客 的 信息 : 


CUSTOMER_NAME 





Contemporary Casuals 
Value Furniture 

Home Furnishings 
Eastern Furniture 
Impressions 

California Classics 
American Euro Lifestyles 
Battle Creek Furniture 
Mountain Scenes 

9 rows selected. 


a) 处 理 -个 非 相 关子 查询 
图 8-2 子 查 询 处 理 
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SELECT DISTINCT ORDER _ID FROM ORDER LINE _T 
WHERE EXISTS 
(SELECT * 
FROM PRODUCT _T 
WHERE PRODUCT _ID = ORDER LINE _T.PRODUCT _ID 
AND PRODUCT _FINISH = ‘Natural Ash ); 













2—>C2 Loffee Table atural Ash > 

SS 4 一 和 3 Computer Desk atural Ash > $375 00 20001 

+ 4 Entertainment Center Natural Maple $650 90 30001 

+ 5 Wrniter's Desk Chery $325 00 10901 | 
* 6 8-Drawer Dresser White Ash $750 00 20001 | 
+ 7 Dining Table $800 00 20001 | 
人 8 Computer Desk Walnut $250 00 30001 | 
CI _ Wm | 


1. 从 表 ORDER_LINE_T 中 选择 第 一 个 订单 ID: ORDER_ID=1001. 
2. 执 行 了 查询 来 判断 订单 中 是 否 包 含 天 然 白 蜡 木 产品 。 产 品 2 是 大 然 白 蜡 林 产品 并 且 包 含 在 订单 中 ， 因 此 
EXISTS 为 真 、 这 个 订单 ID 被 加 入 结果 表 中 。 
3. 从 表 ORDER_LINE_T 中 选择 第 一 个 订单 ID: ORDER_ID=1002. s 
4. 抉 行 子 查 询 来 判断 订单 中 是 否 包 含 天 然 白 蜡 森 产品。 产品 3 符 合 要 求 ， 因 此 EXISTS 为 真 ， 这 个 订单 ID 被 加 入 


结果 表 ! 中 。 
5. 对 每 个 订单 ID 进行 相同 的 处 理 。 订 单 1004、1005 和 1010 设 有 包括 在 结果 表 中 ， 这 是 因为 它们 不 包含 任何 天 然 


白蜡 木 制 成 的 家 具 。 最 后 的 结果 表 见 本 章 查 询 11 的 在 询 结 果 。 
b) 处 理 一 个 相关 子 查询 

图 8-2 ( 续 ) 
查询 13 哪些 家 具 的 标准 价格 超出 了 平均 标准 价格 ? 


SELECT PRODUCT DESCRIPTION， STANDARD PRICE, AVGPRICE 





FROM 
(SELECT AVG(STANDARD PRICE) AVGPRICE FROM PRODUCT T), 
PRODUCT T 
WHERE STANDARD PRICE > AVGPRICE; 
结果 : 
PRODUCT DESCRIPTION STANDARD PRICE AVGPRICE 
Entertainment Center 650 440.625 
8-Drawer Dresser 750 440.625 
Dining Table 800 440.625 
8.3.9 组合 查询 


可 以 使 用 UNION 子 句 将 多 个 查询 所 得 的 结果 合并 成 一 张 单独 的 结果 表 。 为 了 使 用 UNION 
子 句 ， 每 个 相关 查询 结果 中 的 行 数 必须 相同 ， 并 且 是 可 以 使 用 UNION 的 。 这 要 求 每 个 查询 结 
果 的 对 应 列 的 数据 类 型 都 应 该 是 兼容 的 。 不 同 厂商 的 数据 类 型 的 兼容 性 可 能 有 所 不 同 。 执 行 并 
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操作 时 ， 需 要 合并 同一 人 列 上 的 不 同 数据 类 型 ， 即 进行 数据 类 型 转换 ; 在 这 种 情况 下， 最 安全 的 
方式 是 由 程序 员 使 用 CAST 命 令 控制 数据 类 型 的 转换 。 例 如 ，ORDER_T 表 中 的 数据 类 型 DATE 
可 能 应 该 转换 成 文本 类 型 。 实 现 这 个 操作 的 SQL 命 令 如 下 所 示 : 
SELECT CAST(ORDER DATE AS CHAR) FROM ORDER TT; 
下 面 的 例子 查询 购买 松 谷 家 具 公 司 产 品 数量 最 多 的 客户 ， 以 及 购买 数量 最 小 的 客户 ， 然 后 
把 结果 放 在 同一 张 表 中 返回 。 
查询 14 
SELECT C1.CUSTOMER ID,CUSTOMER NAME,ORDERED QUANTITY, 'LARGEST 
QUANTITY' QUANTITY 
FROM CUSTOMER T C1,ORDER T O1,ORDER LINE T Q1 
WHERE C1.CUSTOMER_ID=01.CUSTOMER ID 
AND O1.0RDER ID=Q1.0ORDER 1D 
AND ORDERED QUANTITY= 
(SELECT MAX(ORDERED QUANTITY) 
FROM ORDER LINE T 
UNION 
SELECT Cl.CUSTOMER ID,CUSTOMER NAME,ORDERED QUANTITY, 'SMALLEST 
QUANTITY ' 
FROM CUSTOMER T C1,ORDER T O1,ORDER LINE T Q1 
WHERE C1.CUSTOMER ID=01.CUSTOMER ID 
AND O1.ORDER ID=Q1.0RDER ID 
AND ORDERED QUANTITY= 
(SELECT MIN(ORDERED QUANTITY) 
FROM ORDER LINE T) 
ORDER BY ORDERED QUANTITY 


注意 ， 为 了 保证 可 读 性 ， 创 建 了 一 个 名 为 QUANTITY 列 ， 以 字符 串 “Smallest Quantity” 
或 “Largest Quantity” 为 值 。ORDER BY 子 句 用 于 指定 输出 行 的 排列 顺序 。 


结果 : 

CUSTOMER ID CUSTOMER_NAME ORDERED QUANTITY QUANTITY 
1 Contemporary Casuals 1 Smallest Quantity 
2 Value Furniture 1 Smallest Quantity 
1 Contemporary Casuals 10 Largest Quantity 


8.3.10 条 件 表 达 式 










通过 在 语句 中 使 用 CASE 关 键 字 ， 可 以 在 SQL 表达 式 | {CASE expression 

rrIE- _ ， _ pi {WHEN expression 
中 建立 下 THEN ELSE 逻 辑 处 理 ， 图 8 3 给 出 了 CASE 的 语 THEN {expression | NULLY}... 
法 ， 实 际 上 它 有 四 种 形式 。CASE 的 形式 可 以 是 等 于 某 一 | (WHEN predicate 






THEN {expression | NULL]} . . . 
[ELSE {expression NULLY) 
END } 

| (NULLIF (expression, expression) } 
| (COALESCE (expression .. ,) } 


个 值 的 表达 式 或 谓词 。 谓 词 形式 基于 三 值 逻辑 ( 真 、 假 、 
未 知 ) ， 但 允许 进行 更 复杂 的 操作 。CASE 语 句 的 值 表达 
式 形 式 需 要 与 某 个 值 表达 式 相 匹配 。NULLIF 和 
COALESCE 是 与 其 他 两 种 CASE 表 达 式 有 关 的 关键 字 。 


8.4 保证 事务 完整 性 图 8-3 CASE 条 件 请 法 


关系 DBMS 与 其 他 数据 库 管理 器 有 一 点 是 相同 的 ， 即 它们 的 基本 任务 是 确保 数据 维护 的 正 
确 性 和 完整 性 。 数 据 维 护 在 称 为 事务 的 工作 单元 中 定义 ， 该 单元 中 包括 了 一 个 或 多 个 数据 操纵 
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命令 。 事 务 是 由 一 组 联系 紧密 的 更 新 命令 组 成 的 完整 集合 ， 集 合 中 的 命令 要 么 全 部 执行 ， 要 么 
全 部 不 执行 ， 从 而 保证 数据 库 的 正确 性 。 考 察 图 8-4， 例 如 ， 当 输入 一 个 订单 到 松 谷 家 县 公司 的 
数据 库 时 ， 订 单 的 所 有 项 都 应 该 同时 输入 。 因 此 ， 要 么 将 ORDER_T 中 的 订单 的 所 有 ORDER_ 
LINE_T 行 都 输入 ， 要 么 所 有 信息 都 不 输入 。 这 里 ， 事 务 就 是 完整 的 一 张 订 单 ， 而 不 是 订单 中 的 
部 分 数据 。 我 们 需要 一 些 命令 来 定义 事务 范围 ， 提 交 事务 使 数据 库 被 永久 性 地 更 改 ， 以 及 在 必 
要 时 正确 中 止 一 个 事务 的 执行 。 除 此 以 外 ， 还 需要 有 数据 恢复 服务 ， 以 便 在 事务 执行 中 出 现 数 
据 库 操作 噶 常 中 止 后 进行 清理 。 比 如 ， 订 单 是 正确 的 .但 是 正在 输入 订单 的 时 候 ， 出 现 了 计算 
机 系统 故障 或 断 电 。 存 这 种 情况 下， 用 户 不 希望 对 数据 库 的 修改 一 部 分 生效 而 其 他 部 分 无 效 。 
如 采 要 保持 数据 库 的 正确 性 ， 那 么 在 一 个 事务 中 对 数据 库 的 修改 要 么 全 部 生效 ， 要 么 全 部 撤销 。 





BEGIN transaction 
INSERT Order_ID, Order date，Customer ID into 0rder ti 
INSERT 0Order_ID，pProduct_ID，Quantity into Order_line +; 


INSERT Order_ID, Product_ID, Quantity into Order_line t; 
INSERT Order_ID, Product_ID, Quantity into Order_line t; 





END transaction 








输入 无 效 Product_ID 一 一 


插入 有 效 信息 
块 行 提交 (COMMIT ) 事务 将 被 取消 (ABORTED) 

半 Order_t 进 行 的 所 有 修改 lol 深 (ROLLBACK ) 
数据 永久 改变 


对 Order_t 和 Order_Jine_t 所 作 的 所 
有 修改 被 取消 、 数 据 库 i 到 事务 
开始 前 的 状态 


图 8-4 一 个 SQL 事务 序列 〈( 伪 代码 形式 ) 


当 一 个 单独 的 SQL 命令 组 成 了 一 个 事务 时 ，-- 些 RDBMS 在 命令 执行 后 自动 地 提交 或 癌 滚 。 
如 果 有 一 个 用 户 自 定义 事务 ， 其 中 包含 多 条 SQL 命令 ， 这 些 SQL 命令 要 么 全 部 提交 ， 要 么 全 部 
回 深 ， 那 么 就 需要 管理 事务 的 命令 。 许 多 系统 提供 了 BEGIN TRANSACTION 和 END 
TRANSACTION 命 令 ， 可 以 用 这 两 条 命令 标记 一 个 逻辑 单元 的 事务 范围 。BEGIN 
TRANSACTION 创 建 一 个 日 志文 件 ， 并 开始 在 该 文件 中 记录 所 有 对 数据 库 的 修改 (插入 、 删 除 
和 更 新 )。END TRANSACTION 或 COMMIT WORK 提 取出 日 志文 件 的 内 容 并 应 用 于 数据 库 中 
(这 样 就 实现 了 永久 性 改变 ) ， 然 后 清空 日 志文 件 。ROLLBACK WORK 提 请 SQL 清 空 日 志文 件 。 
有 一 些 RDBMS 广 商 还 提供 AUTOCOMMIT(ON/OFF) 命 令 ， 如 果 选 择 ON， 表示 在 每 条 数据 修 
改 命令 之 后 都 对 数据 项 做 永久 性 的 改变 ， 而 选择 OFF， 则 表示 需要 由 COMMIT WORK 命 令 来 
显 式 标识 对 数据 库 做 永久 性 改变 。 

用 户 自 定义 事务 能 够 改善 系统 性 能 ， 因 为 将 若 干事 务 作为 集合 处 理 比 逐 个 处 理事 务 减 少 了 
系统 负载 。 当 AUTOCOMMIT 置 为 OFF 时 ， 除 非 达到 显 式 指定 的 事务 结束 点 ， 否 则 不 会 自动 地 
修改 数据 库 。 当 AUTOCOMMIT 置 为 ON 时 ， 在 每 条 SQL 语句 的 执行 后 ， 都 自动 修改 数据 库 ; 
这 在 必须 作为 整体 被 提交 或 回 滚 的 用 户 自 定义 事务 中 是 不 允许 的 。 

SET AUTOCOMMIT 是 一 个 交互 式 的 命令 ， 所 以 可 以 根据 适当 的 完整 性 标准 对 一 个 用 户 会 
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话 进 行动 态 改变 。 一 般 情 况 下 ， 一 条 SQL INSERT、UPDATE 或 DELETE 命令 在 某 一 时 刻 只 能 
对 -- 张 表 进 行 操作 。 而 要 完成 某 些 数据 维护 工作 则 需要 更 新 多 张 表 。 因 此 ， 这 些 保持 事务 完整 
性 的 命令 就 显得 很 重要 ， 对 于 一 组 必须 全 部 做 完 的 修改 数据 库 的 操作 ， 可 以 使 用 这 些 命令 清晰 
地 把 这 些 修改 定义 为 一 个 完整 的 逻辑 单元 ， 以 保持 数据 库 完整 性 。 

进一步 来 说 ， 某 些 SQL 系 统 具 有 并 发 控制 功能 ， 它 解决 并 发 用 户 对 共享 数据 库 的 更 新 。 数 
据 库 的 变化 可 以 在 日 志 中 记录 下 来 ， 所 以 如 果 在 事务 处 理 过 程 中 出 现 异 常 中 止 的 情况 ， 则 数据 
库 可 以 利用 日 志 恢 复 。 这 些 系统 还 可 以 撤销 错误 的 事务 。 例 如 ， 在 银行 应 用 中 ， 两 个 并 发 用 户 
对 同一 个 银行 账号 余额 的 修改 应 该 累积 。 在 SQL 中 ， 这样 的 控制 对 用 户 来 说 是 透明 的 : 不 需要 
用 户 编 程 来 控制 数据 的 并 发 访问 。 为 了 保证 一 个 数据 库 的 完整 性 ， 应 该 注意 事务 完整 性 及 恢复 
问题 ， 并 确保 应 用 程序 开发 人 员 知道 应 该 在 何 时 使 用 这 些 命令 。 


8.5 数据 字典 工具 


RDBMS 的 数据 库 定义 信息 存储 在 系统 创建 的 表 中 ， 我 们 可 以 将 这 些 系 统 表 看 做 数据 字典 。 
无 论 是 用 户 还 是 数据 库 管 理 员 ， 都 应 该 熟悉 所 使 用 的 RDBMS 的 系统 表 ， 它 们 能 提供 很 多 有 用 
的 信息 。 既 然 信息 存储 在 表 中 ,用 户 也 可 以 通过 SQL SELECT 语句 对 其 进行 访问 ， 得 到 关于 系 
统 使 用 、 用 户 权限 和 约束 等 的 报表 。 而 且 ， 掌 握 系统 表 结 构 的 用 户 可 以 扩展 现 有 的 表 或 构建 其 
他 表 以 增强 内 置 特性 (例如 ， 存 储 负责 数据 完整 性 的 用 户 的 信息 )。 然 而 ， 用 户 往往 不 能 对 系 
统 表 结构 和 内 容 做 直接 修改 ， 因 为 DBMS 需 要 维护 这 些 表 ， 并 根据 这 些 表 来 解释 和 分 析 查 询 。 

每 个 RDBMS 包 含 不 同 的 系统 表 。 在 Oracle 8i 中 ， 数 据 库 管理 员 可 以 使 用 98 个 数据 字典 视 
图 。 那 些 不 具有 DBA 权 限 的 用 户 也 可 以 使 用 其 中 许多 视图 或 DBA 视 图 的 子 集 ( 与 某 个 用 户 相 
关 的 信息 )。 这 些 表 的 名 字 以 USER 或 ALL 开 头 ， 而 不 是 以 DBA 开 头 。 下 面 列 出 了 保存 有 关 表 、 
往 、 列 和 安全 等 信息 的 表 ( 仅 供 DBA 访 问 )。 还 有 一 些 表 保 存 了 有 关 存 储 、 对 象 、 索 引 、 锁 、 
审计 、 导 出 和 分 布 式 环境 的 信息 。 

* DBA_TABLES 描述 数据 库 中 的 所 有 表 。 

“DBA_TAB_COMMENTS 数据 库 中 所 有 表 的 注释 。 

*。DBA_CLUSTERS 描述 数据 库 中 所 有 的 秘 。 

“DBA_TIAB_COLUMNS 描述 所 有 表 、 视 图 和 乱 的 列 。 

“DBA_COL_PRIVS 包括 数据 库 中 对 列 的 所 有 访问 权限 。 

* DBA_COL_COMMENTS 对 表 和 视图 中 所 有 列 的 注释 。 

“DBA_CONSTRAINTS 在 数据 库 中 所 有 表 的 约束 的 定义 。 

“DBA_CLU_COLUMNS 将 表 中 的 列 映射 到 敌 中 的 列 。 

“DBA_CONS_COLUMNS 关于 所 有 约束 定义 中 列 的 信息 。 

"DBA_USERS 关于 数据 库 中 所 有 用 户 的 信息 。 

“DBA_SYS_PRIVS 描述 授予 用 户 和 角色 的 系统 权限 。 

“DBA_ROLES 描述 数据 库 中 所 有 存在 的 角色 。 

“DBA_PROFILES 包括 指派 给 每 个 预 置 文件 (profile ) 的 资源 限制 。 

“DBA_ROLE_PRIVS 描述 授予 用 户 和 其 他 角色 的 角色 。 

“DBA_IAB_PRIVS 描述 对 所 有 数据 库 中 对 象 的 授权 。 

为 了 使 用 户 对 系统 表 中 出 现 的 信息 类 型 有 所 了 解 ， 我 们 以 DAB_USERS 为 例 进行 介绍 。 
DBA_-USERS 包 括 数据 库 中 合法 用 户 的 相关 信息 ， 包 括 用 户 名 、 用 户 ID、 加 密 后 的 口令 、 默 认 
表 空 间 、 临 时 表 空 间 、 创 建 的 日 期 和 分 配 的 预 置 文件 。DBA_TAB_COLUMNS 有 15 个 属性 ， 
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包括 每 张 表 的 所 有 者 、 表 名 、 列 名 、 数 据 类 型 、 数 据 长 度 、 精 度 和 数值 范围 等 。 下 面 的 SQL 查 
询 在 DBA_TABLES 中 查找 表 PRODUCT_T 的 拥有 者 。 

查询 15 谁 是 PRODUCT_T 的 拥有 者 ? 

SELECT OWNER, TABLE NAME 


FROM DBA TABLES 
WHERE TABLE NAME = 'PRODUCT T'; 


结果 : 


OWNER TABLE _ NAME 
MPRESCOTT PRODUCT TY 


8.6 SQL-99 对 SQL 的 增强 和 扩展 


第 7 章 和 第 8 章 的 前 几 节 已 经 展示 了 SQL 的 简单 性 和 强大 功能 。 然 而 ， 对 业务 分 析 具 有 浓厚 
兴趣 的 读者 想 要 知道 : 在 SQL 中 可 以 使 用 哪些 统计 函数 。 熟 悉 其 他 程序 设计 语言 的 程序 员 可 能 
会 对 以 下 问题 感 兴趣 : 如 何 定义 变量 、 如 何 控制 程序 流程 以 及 如 何 创建 用 户 自 定义 数据 类 型 
(User-Defined Datatype，UDT ) 等 。 随 着 程序 设计 越 来 越 趋向 面向 对 象 ，SQL 将 如 何 调整 呢 ? 
SQL-99 通 过 提供 更 多 的 程序 设计 功能 对 SQL 进行 了 扩展 ， 其 中 的 一 个 改进 是 标准 化 增加 的 统 
计 函 数 。SQL 将 围绕 面向 对 象 概念 修改 相应 的 标准 。 

8.6.1 已 建议 加 入 的 分 析 函 数 

在 SQL-99 的 修正 案 1 中 加 入 了 一 系列 分 析 函 数 作为 对 SQL 语 言 的 扩展 ， 这 些 函 数 称 为 
OLAP (联机 分 析 处 理 ) 函数 。 其 中 的 大 多 数 函 数 已 经 在 Oracle8i R2、DB2 6.2 以 及 Teradata 
V2R4 中 实现 。 在 2001 年 初 ， 这 些 标准 还 没有 被 最 后 确定 ， 所 以 这 些 函 数 的 实现 没有 完全 遵照 
标准 。 修 正 案 解决 了 在 数据 库 引 擎 中 增加 分 析 功 能 的 需求 ， 这 是 一 个 重要 的 发 展 。 线 性 回归 、 
相关 性 分 析 和 移动 平均 数 已 经 不 需要 把 数据 从 数据 库 中 取出 来 再 计算 。 经 过 时 间 的 考验 ，- 一 旦 
修正 案 成 为 正式 的 标准 ， 各 个 厂商 的 实现 将 严格 按照 标准 进行 ， 彼 此 之 间 也 将 更 加 一 致 。 


数 。 像 ROW_NUMBER 和 RANK 这 样 的 函数 将 使 开发 人 员 更 灵活 地 利用 排 好 序 的 结果 。 对 于 数据 
库 的 营销 或 客户 关系 管理 应 用 来 说 ， 有 两 种 功能 是 很 受 欢迎 的 ， 其 一 是 在 数据 库 操作 中 考虑 按 某 
个 属性 排序 中 最 高 的 n 行 ， 另 一 是 按 百 分 比 对 数据 结果 再 次 进行 子 集 划分 。 在 这 些 函 数 引 和 数据 
库 引 擎 并 加 以 优化 后 ， 用 户 可 以 进行 更 高 效 的 数据 库 处 理 。 一 旦 这 些 函 数 被 标准 化 ， 应 用 程序 三 
商 将 可 以 基于 这 些 函 数 开发 应 用 程序 ， 而 不 必 在 数据 库 之 外 自行 创建 实现 这 些 功 能 的 函数 。 

表 8-1 建议 在 SQL-99 中 增加 的 OLAP 画 数 


CEILING PERCENTILE_CONT REGR_SLOPE 
CORR PERCENT_RANK REGR_SXX 
COVAR_POP POWER REGR_SXY 
COVAR_SAMP RANK REGR_SYY 
CUME_DIST RANGE ROW_NUMBER 
DENSE_RANK REGR_AVG SQRT 

EXP REGR_AVGX STDDEV_POP 
FLOOR REGR_AVGY STDDEY_SAMP 
LN REGR_COUNT VAR_POP 
MOVING_AVG REGR_INTERCEPT VAR_SAMP 
MOVING_SUM REGR_R2 


一 vv 


注 ; 源 自 R.Winter 所 著 的 “The Extra Mile”、2000. JIntelligent Enterprise 3(10). p.63, 











如 果 该 修正 案 被 接受 ,那么 SQL 语句 将 引入 一 人 
由 一 列 窗口 定义 组 成 ， 其 中 每 一 项 都 定义 了 一 个 窗口 的 名 字 及 其 规格 说 明 。 规 格 说 明 包 括 了 分 
割 、 排 序 和 肾 合 分 组 等 操作 。 

下 面 的 查询 示例 来 自 一 篇 支持 该 修正 案 的 论文 (Zemke 等 , 1999, p.4)。 

SELECT SH.TERRITORY, SH.MONTH, SH.SALES, 

AVG(SH.SALES) OVER WI AS MOVING AVERAGE 

FROM SALES HISTORY AS SH 

WINDOW W1 AS(PARTITION BY (SH.TERRITORY) 

ORDER BY(SH.MONTH ASC) 
ROWS 2 PRECEDING); 


上 例 中 ， 窗 口 名 为 W1， 在 FROM 子 名 之 后 的 WINDOW 子 句 中 定义 。PARTITION 子 句 的 作 
用 是 在 SALES_HISTORY 中 根据 TERRITORY (地 区 ) 分 割 记 录 行 。 在 每 个 地 区 分 割 中 ， 记 录 
行 按 月 份 升序 排列 。 最 后 ， 定 义 察 集 分 组 为 当前 行 和 前 述 两 个 记录 行 的 划分 结果 ， 按 ORDER 
BY 子 句 定义 的 次 序 排序 。 这 样 ， 就 返回 了 每 个 地 区 销售 情况 的 移动 平均 数 MOVING_ 
AVERAGE。 

8.6.2 程序 设计 能 力 扩 展 

SQL-92 和 更 早 的 标准 将 SQL 作为 一 个 数据 检索 和 处 理 语言 ， 而 不 是 一 个 应 用 程序 语言 。 因 
此 ， 为 了 创建 面向 业务 的 应 用 程序 、 过 程 或 函数 ， 必 须 将 SQL 和 其 他 完全 的 计算 性 语言 (如 C 
和 Java) 等 连接 使 用 。SQL-99 通 过 在 Core SQL、SQLPSM 和 SQL/OLB 中 加 和 新 的 编程 功能 ， 
扩展 了 SQL 的 程序 设计 能 力 。 

为 了 使 SQL 成 为 完全 的 计算 性 语言 ， 应 该 扩展 程序 流程 控制 功能 ， 如 提供 IF-THEN、FROR、 
WHILE 语句 以 及 循环 ， 这 包含 在 基本 SQL 规格 说 明 的 一 个 扩展 包 中 。 这 个 包 称 为 持久 化 存储 
模块 (Persistent Stored Module ，SQL/PSM ) ,该 包 中 存储 了 创建 和 删除 程序 模块 的 功能 。 持 久 
性 (persistent) 意味 着 代码 模块 在 被 显 式 删 除 以 前 将 一 直 存 储 在 数据 库 中 ， 并 随时 可 用 于 执行 
用 户 会 话 ， 其 持久 性 正如 基 表 一 样 ， 如 果 没 有 将 其 显 式 删除 将 永久 存储 。 每 个 模块 作为 一 个 模 
式 对 象 保存 在 数据 库 模 式 中 。 一 个 数据 库 模 式 可 能 没有 程序 模块 ， 也 可 能 拥有 多 个 程序 模块 。 

每 个 模块 必须 有 一 个 名 字 、 一 个 授权 ID、 和 某 一 模式 的 关联 、 所 使 用 的 字符 集 的 声明 、 所 
有 在 模块 运行 时 需要 的 临时 表 声 明 。 每 个 模块 必须 包括 一 个 或 多 个 SQL 过 程 ， 这 些 过 程 被 称 为 
程序 ， 每 一 个 程序 在 被 调用 时 运行 一 个 SQL 语句 。 每 个 SQL 过 程 必须 包括 一 个 作为 状态 参数 的 
SQLSTATE 声 明 ， 该 参数 表示 SQL 语句 是 否 能 成 功 运行 。 

SQL/PSM 直 接 使 用 SQL 数 据 类 型 创建 应 用 、 过 程 和 函数 。SQL/PSM 为 SQL 引 入 了 过 程 性 ， 
这 样 语句 将 按 顺 序 进 行 处 理 。 记 住 ，SQL 本 身 是 一 种 非 过 程 性 语言 ， 并 不 明确 指出 语句 的 运行 
顺序 。SQL/PSM 包 括 了 如 下 几 个 SQL 控制 语句 : 

“CASE 使 用 搜索 条 件 或 值 表达 式 ， 根 据 值 比较 的 结果 或 WHEN 子 句 的 值 ， 执 行 不 同 的 

SQL 语句 。 其 逻辑 类 似 于 SQL CASE 表 达 式 ， 但 以 END CASE 而 不 是 END 结 束 ， 没 有 与 

ELSE NULL 子 名 的 等 价 子 句 。 

*IF 如果 谓 词 为 TRUE， 则 执行 其 后 的 SQL 语句 。IF 语 名 以 ENDIF 结 尾 ， 并 可 包括 ELSE 和 

ELSEIF 语 句 来 管理 不 同 条 件 下 的 流程 控制 。 

“LOOP 重复 运行 一 个 语句 直至 满足 跳出 循环 的 条 件 。 

“LEAVE 用 于 设 定 退 出 循环 的 条 件 。 

“FOR 对 于 结果 集中 的 每 一 行 都 运行 一 次 的 语句 。 

*。WHILE ”如果 特定 条 件 成 立 ， 就 循环 执行 一 条 语句 。 可 与 LEAVE 语 句 联合 使 用 。 
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。REPEAT 与 WHILE 语 名 类似， 但 其 循环 条 件 在 SQL 语句 执行 之 后 再 检验 。 

"ITERATE 用 于 重新 开始 执行 一 个 循环 的 语句 。 

SQL/PSM 承 诺 将 解决 基本 SQL 中 的 几 处 众所周知 的 缺点 。 现 在 还 很 难 断定 程序 员 更 乐于 使 
用 SQL/PSM ， 还 是 继续 使 用 宿主 语言 ， 通 过 财 入 式 SQL 或 CLI 调 用 SQL 。 然而， 新 标准 提供 了 
以 下 功能 : 

* 可 以 在 SQL 中 创建 过 程 和 国 数 ， 可 以 接收 输入 和 输出 参数 ， 并 直接 返回 一 个 值 。 

“在 SQL 中 可 以 检测 和 处 理 错误 ， 而 不 必 通 过 其 他 语言 处 理 错误 。 

。 用 DECLARE 语 句 创建 变量 ， 这 些 变量 的 作用 范围 是 包含 它们 的 过 程 、 方 法 或 图 数 。 

* 成 组 传递 SQL 语句 而 不 是 逐条 传递 语句 ， 从 而 提高 了 性 能 。 

* 处理 阻抗 失 配 问题 ， 即 SQL 处 理 数据 的 集合 ， 而 模块 中 的 过 程 只 处 理 单行 的 数据 。 

SQL/PSM 还 没有 完全 实现 ， 所 以 本 章 也 没有 给 出 扩展 语法 的 例子 。Oracle 的 PL/SQL 在 代 
码 模块 方面 与 新 标准 有 和 雷同 之 处 ， 如 BEGIN-END、LOOP、WHILE 等 语句 。SQL/PSM 还 没有 
广泛 流行 ,但 这 种 局 面 将 很 快 得 到 改观 。 


8.7 触发 器 和 例 程 


在 SQL-99 颁 布 以 前 , SQL 标准 不 支持 用 户 自 定义 函数 或 过 程 。 由 于 用 户 对 这 种 功能 有 需求 ， 
所 以 商用 的 数据 库 管 理 系统 中 已 经 实现 了 这 些 功能 。 我 们 希望 这 些 产品 的 语法 能 在 将 来 变 得 更 
符合 SQL-99 的 要 求 ， 就 如 同 我 们 希望 看 到 包括 SQL/PSM 标 准 一 样 。 

触发 器 (trigger) 和 例 程 是 功能 很 强 的 数据 库 对 象 ， 因 为 它们 存储 在 数据 库 中 并 由 DBMS 
控制 。 用 于 创建 触发 器 和 例 程 的 代码 被 存储 在 一 处 并 集中 管理 。 这 有 利于 加 强 数 据 完整 性 和 一 
致 性 。 因 为 它们 只 存储 一 次 ， 所 以 也 简化 了 代码 的 维护 (Mullins, 1995 )。 

触发 器 和 例 程 都 由 过 程 性 代码 块 所 组 成 。 触 发 器 代码 存储 在 数据 库 中 ， 并 在 触发 器 事件 
(如 UPDATE) 发 生 时 自动 执行 。 相 反 ， 例 程 不 会 自动 运行 ， 例 程 是 必须 被 调用 执行 的 代码 块 
(参见 图 8-5 ) 。 

例 程 






调用 | 
Procedure_name 存储 过 程 
(parameter_value:) 


返 巾 值 或 
执行 例 程 















a 
触发 
”插入 
更 新 
删除 
隐 式 执行 


图 8-5 触发 器 与 存储 过 程 的 比较 (改编 自 Mullins，1995) 
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8.7.1 触发 器 

触发 器 存储 在 数据 库 中 并 在 数据 库 中 执行 、 其 执行 和 所 有 访问 数据 库 的 应 用 程序 有 关 。 触 
发 器 可 以 是 级 联 的 ， 在 一 个 触发 器 中 触发 其 他 触发 器 。 因 此 .客户 端的 一 个 请 求 可 能 会 导致 在 
服务 器 上 进行 一 连 串 的 完整 性 或 逻辑 检查 , 但 不 会 引发 大 量 的 服务 器 和 客户 端 之 间 的 网 络 传输 。 
触发 器 可 以 用 于 保证 参照 完整 性 、 实 施 业 务 规则 、 创 建 审计 跟踪 、 复 制 表 或 激活 过 程 
(Rennhackkamp, 1996 ) 。 

约束 可 以 视 为 一 种 特殊 的 触发 器 ， 它 也 能 够 在 数据 被 修改 后 自动 要 行 (触发 )， 但 其 准确 
的 语法 由 DBMS 决 定 ， 而 且 也 不 像 触 发 器 那样 灵活 。 

触发 器 由 二 部 分 组 成 ， 即 事件 (event)、 条 件 (condition ) 和 动作 (action )， 而 这 些 部 分 
也 反映 在 触发 器 的 代码 结构 中 ( 见 图 8-6 中 的 触发 器 语法 示例 )。 下 面 是 一 个 用 PL/SQL 书 写 的 
简单 的 触发 器 例子 。 | 

CREATE TRIGGER ORDER ID BIR 

BEFORE INSERT ON ORDER T 

FOR EACH ROW 

BEGIN 

SELECT ID SEQUENCE .NEXTVAL 

INTO :NEW.ORDER ID 


FROM DUAL; 
END ORDER_ID BIR; 


当 插 入 -- 张 新 的 订单 时 、 这 个 触发 器 将 自动 插入 一 个 订单 号 。BIR 是 触发 器 命名 规则 的 一 
部 分 ， 代 表 人 在 插入 行 以 前 (Before Insert Row )。 触 发 器 既 可 以 在 激活 触发 器 的 语句 执行 之 前 执 
行 ， 也 可 以 在 其 后 执行 。INSERT、UPDATE 或 DELETE 命 令 都 可 以 激活 触发 器 。 触 发 可 以 在 每 
一 行 被 改变 时 触发 ， 也 可 以 在 每 一 条 语句 运行 时 触发 (无 论 有 多 少 行 被 改变 )。 在 上 面 描述 的 
例子 中 ， 触 发 器 将 在 每 张 订单 插入 数据 库 之 前 插入 订单 号 。 一 个 只 在 库存 被 更 新 之 后 才 检 查 其 
库存 水 平 的 触发 器 ， 应 该 用 AUR 命 名 标签 。 上 述 触发 器 也 需要 一 个 预先 定义 的 名 为 ID_ 
SEQUENCE 序列 ， 该 序列 中 的 下 一 个 值 将 被 用 作 下 一 个 订单 号 。 

在 使 用 触发 器 时 开发 人 员 应 该 谨慎 。 内 为 触发 器 是 自动 触发 的 ， 除 非 触发 器 中 包括 了 显示 
给 用 户 的 信息 ， 否 则 用 户 不 会 意识 到 触发 器 已 经 被 触发 了 。 同 样 ， 触 发 器 还 能 够 级 联 触 发 并 导 
致 其 他 触发 器 执行 。 例 如 ， 一 个 BEFORE UPDATE 和 触发 器 可 能 要 求 在 另 一 张 表 中 插 人 一行 ， 
如 果 那 张 表 有 一 个 BEFORE INSERT 触 发 器 ， 则 第 一 个 触发 器 也 会 被 触发 ， 这 样 会 导致 不 希望 
的 结果 ， 其 至 有 可 能 产生 一 个 不 能 结束 的 触发 器 循环 ( 即 死 循 环 )。 因 此 ， 使 用 触发 器 实施 复 
杂 的 业务 规则 、 创 建 复杂 的 审计 日 志和 建立 复杂 的 安全 授权 时 ， 必 须 十 分 小 心 。 


CREATE {OR REPLACE] TRIGGER trigger_name 
{BEFORE AFTER) {INSERT | DELETE | UPDATE} ON table_name 


[FOR EACH ROW [WHEN (trigger_condition)]] 
trigger_body_here; 





图 8-6 简化 的 Oracle PL/SQL 触发 器 语法 


8.7.2 例 程 

SQL 中 调用 的 例 程 可 以 是 过 程 或 函数 。 此 处 提 到 的 过 程 和 函数 与 其 他 程序 设计 语言 中 的 过 
程 和 国 数 的 使 用 方式 是 相同 的 。 函数 (function ) 只 有 一 个 返回 值 和 输入 参数 。 过 程 
(procedure) 可 以 有 输入 参数 、 输 出 参数 和 既是 输入 也 是 输出 的 参数 。 可 以 使 用 RDBMS 的 专 有 
代码 来 声明 和 命名 一 个 过 程 性 代码 单元 ， 也 可 以 调用 一 个 宿主 语言 的 库 例 程 。 在 SQL-99 之 前 ， 
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SQL 厂商 已 经 开发 了 各 自 的 例 程 ， 所 以 在 使 用 这 些 产 品 之 前 ， 应 该 熟悉 它们 的 语法 和 功能 。 其 
中 的 一 些 专 有 语言 ， 如 Oracle 的 PL/SQL， 已 得 到 广泛 使 用 ， 并 将 继续 有 效 。 

SQL 例 程 的 优点 包括 : 

。 灵 活性 ” 例 程 的 使 用 范围 比 约束 或 触发 器 更 广 ， 约 束 和 触发 器 仅 限 于 在 数据 修改 的 情况 

下 使 用 。 正 如 触发 器 比 约束 具有 更 多 可 选 代码 ， 例 程 比 触发 器 具有 更 多 可 选 代码 。 

“高 效 性 例 程 可 以 被 精心 设计 并 优化 ， 使 其 运行 速度 比 常规 SQL 语句 更 快 。 

* 共享 性 例 程 可 以 高 速 缓 存在 服务 器 上 ， 供 所 有 用 户 使 用 ， 用 户 不 必 重 新 编写 。 

。 适 应 性 ” 例 程 可 以 应 用 于 整个 数据 亩 ， 而 不 仅仅 属于 一 个 应 用 程序 。 这 个 优点 是 从 共享 

性 推导 出 来 的 。 

SQL-99 创 建 过 程 和 函数 的 语法 如 图 8-7 所 示 。 可 以 看 出 ， 语 法 是 很 复杂 的 ， 这 里 也 不 打算 
深入 讨论 每 一 个 子 句 。 随 后 的 一 个 简单 的 过 程 将 帮助 读者 理解 这 些 代码 是 如 何 工作 的 。 

过 程 是 一 个 过 程 性 的 SQL 命令 集 , 在 模式 中 被 分 配 了 一 个 惟一 的 名 字 ,， 并 存储 在 数据 库 中 。 
当 需 要 运行 过 程 时 ， 就 通过 它 的 名 字 来 调用 。 调 用 过 程 时 ， 过 程 中 的 所 有 语句 都 将 被 执行 。 过 
程 的 这 个 特征 有 助 于 减少 网 络 传输 ， 因 为 所 有 的 语句 将 同时 传送 ， 而 不 是 逐条 传送 。 
{CREATE PROCEDURE | CREATE FUNCTION] routine_name 
{[parameter [{,parameter} .. .]]) 
[RETURNS data_type result_castl /* for functions only */ 
[LANGUAGE {ADA|C|COBOL|FORTRAN | MUMPS | PASCAL |PLI| SQL 
[PARAMETER STYLE {SQL | GENERALY 
[SPECIFIC specific_name] 
[DETERMINISTIC | NOT DETERMINISTIC] 
[NO SQL | CONTAINS SQL |READS SQL DATA | MODIFIES SQL DATA] 
{RETURN NULL ON NULL INPUT | CALL ON NULL INPUT] 
[DYNAMIC RESULT SETS unsigned_integer] /* for procedures only */ 


[STATIC DISPATCH] f* for functions only */ 
routine_body 






















图 8-7 SQL-99 中 创建 例 程 的 语法 


为 了 创建 一 个 简单 的 设置 销售 价格 的 过 程 ， 在 已 有 的 PRODUCT_T 表 中 加 了 一 个 新 列 
SALE_PRICE， 该 列 用 来 存放 产品 的 售 价 。 


ALTER TABLE PRODUCT T 
ADD(SALE PRICE DECIMAL(6,2)); 


表 已 经 改变 了 。 
下 面 这 个 简单 的 过 程 将 执行 两 条 SQL 语句 。STANDARD_PRICE 为 400 美 元 或 价格 更 高 的 


曲折 扣 为 10% ， 低 于 400 美 元 的 产品 折扣 为 15%。 以 下 是 Oracie 代 码 模块 ， 它 创建 和 存储 了 名 
PRODUCT_LINE_SALE 的 过 程 。 


CREATE OR REPLACE PROCEDURE PRODUCT LINE SALE 
AS BEGIN 

UPDATE PRODUCT 了 

SET SALE PRICE = “90*STANDRARD _ PRICE 

WHERE STANDARD_PRICE >= 400; 

UPDATE PRODUCT T 

SET SALE PRICE = .85*STANDARD PRICE 

WHERE STANDARD PRICE < 400; 
END; 








如 果 语 法 正确 ，Oracle 将 返回 一 个 注释 : “Procedure created”。 

可 以 使 用 下 面 的 命令 在 Oracle 中 执行 这 个 过 程 。 

SQL>EXEC PRODUCT LINE SALE . 

然后 Oracle 给 出 结果 如 个 : 

PL/SQL procedure successfully completed. Now PRODUCT T contains: 


PRODUCT_ LINE PRODUCT ID PRODUCT DESCRIPTION PRODUCT FINISH STANDARD PRICE SALE PRICE 





10001 1 End Table Cherry 175 148.75 
20001 2 Coffee Table Natural Ash 200 170 
20001 3 Computer Desk Natural Ash 375 318 .75 
30001 4 Entertainment Center Natural Maple 650 585 
10001 5 Writers Desk Cherry 325 276.25 
20001 6 8-Drawer Dresser White Ash 750 675 
20001 7 Dining Table Natural Ash 800 720 
30001 8 Computer Desk Walnut 250 212.5 


8.8 艇 入 式 SQL 和 动态 SQL 

SQL-99 中 的 SQL/PSM 将 具有 一 定 的 编程 功能 ， 而 这 些 功能 已 经 在 嵌入 式 SQL 和 动态 SQL 中 
得 以 实现 。 在 SQL-99 之 前 ， 我 们 就 可 以 使 用 联 和 人 式 SQL 和 动态 SQL 来 开发 数据 库 应 用 。 开 发 
SQL 的 最 初 目的 仅仅 是 为 了 处 理 数 据 库 访 问 ， 而 并 不 具备 流程 控制 功能 或 其 他 创建 应 用 程序 所 
必需 的 结构 。 储 入 式 SQL (embedded SQL ) 是 指 在 一 个 使 用 其 他 语言 (如 C、Cobol、Ada 或 
Java) 编写 的 程序 中 包含 硬 编码 的 SQL 语句 的 方法 。 动 态 SQL 在 运行 时 才 生 成 明确 的 SQL 语句 。 
程序 员 编写 API (应 用 程序 接口 ，Application Programming Interface) 实现 两 种 语言 之 间 的 接口 。 

在 编写 本 书 时 ， 使 用 最 广泛 的 API 是 开放 数据 库 互 连 (ODBC) 标准 ，SQL-99 标 准 中 包括 
了 SQL 调 用 级 接口 (SQL/CLI)， 两 者 都 是 用 C 语 言 编写 的 ， 并 且 都 基于 相同 的 早期 标准 。Java 
数据 库 互 连 (JDBC) 是 一 种 用 于 从 Java 连 接 数 据 库 的 行业 标准 ， 但 还 不 是 1SO 标 准 。 

要 做 和 人 SQL， 可 将 SQL 语 句 置 人 宿主 程序 的 源 代码 中 ， 并 在 其 前 面 加 上 短语 EXEC SQL。 
项 编译 器 将 把 SQL 语句 转换 为 宿主 语言 能 解释 的 语句 ， 生 成 一 个 数据 库 请 求 模块 (Database 
Reguest Module，DBRM)。 一旦 宿主 文件 被 编译 成 目标 代码 ， 链 接 器 程序 将 宿主 语言 中 的 
DBMS 调 用 和 DBMS 库 链接 起 来 。 有 一 个 通常 被 称 为 BIND 的 程序 ， 它 的 任务 是 处 理 访 问 模块 
中 的 SQL 语句 ， 解 析 和 验证 每 一 条 语句 ， 并 且 产 生 试 图 优化 语句 执行 过 程 的 访问 计划 。 对 -一些 
DBMS 来 说 ， 访 问 计 划 不 在 执行 时 确定 ， 而 是 根据 数据 库 的 当前 状态 而 决定 。 访 问 计 划 以 及 其 
他 必要 的 附加 信息 既 可 以 存储 在 数据 库 中 ， 也 可 以 存储 在 一 个 外 部 代码 模块 中 。 当 数 据 库 中 的 
内 存 限制 了 对 数据 库 的 访问 时 ， 该 模块 可 被 任何 数据 库 实例 访问 和 使 用 。 艇 入 式 SQL 比 交 互 式 
SQL 的 效率 更 高 ， 因 为 它 能 够 更 好 地 利用 存储 在 库 中 的 信息 。 一 旦 确定 ， 访 问 计 划 和 过 程 调用 
等 对 开发 者 而 言 都 是 透明 的 。 

动态 SQL (dynamic SQL) 用 于 在 应 用 程序 执行 时 动态 地 生成 SQL 代码 。 大 多 数 程序 员 在 
编写 数据 库 应 用 程序 时 使 用 API， 如 ODBC， 这 样 可 以 在 所 有 ODBC 兼 容 的 系统 上 移植 。 动 态 
SQL 是 大 多 数 Internet 应 用 的 核心 ， 这 一 点 我 们 将 在 第 10 章 详细 描述 。 由 于 确切 的 SQL 查询 在 应 
用 程序 执行 时 才 确 定 ， 包 括 传递 的 参数 个 数 、 要 访问 的 表 ， 等 等 ， 因 此 ， 开 发 人 员 能 够 创建 更 
为 灵活 的 应 用 。 动 态 SQL 在 SQL 语 句 的 框架 将 重复 使 用 的 情况 下 非常 有 用 ， 只 需 在 每 次 执行 时 
动态 改变 其 参数 即 可 。 

随 着 SQL-99 的 实现 更 完整 ， 嵌 和 人 式 SQL 和 动态 SQL 的 使 用 将 更 加 标准 化 ， 因为 这 个 标准 第 
一 次 建立 了 具备 完整 计算 能 力 的 SQL 语 言 。 大 多 数 厂商 已 经 比 标准 先行 一 步 ， 他 们 独立 地 开发 
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了 这 些 功能 ， 因 此 今后 几 年 可 能 是 遵从 SQL-99 的 产品 和 稳定 的 老 版 本 产品 共存 的 一 段 时 期 。 
用 户 应 该 意识 到 出 现 这 种 局 面 的 可 能 性 ， 做 好 应 对 的 准备 。 


本 章 小 结 ” 


本 章 在 第 7 章 介绍 SQL 语言 的 基础 上 ， 进 - 步 讲述 了 等 值 联 结 、 自 然 联结 、 外 联结 和 并 联 
结 。 等 值 联 结 基于 参与 联结 的 表 的 公共 列 的 相间 值 ， 并 返回 一 个 结果 表 ， 表 中 包括 了 参与 联结 
的 各 张 表 中 公共 列 的 值 。 自 然 联结 返回 所 有 查询 到 的 结果 ， 但 公共 列 的 值 只 出 现 一 次 。 外 联结 
返回 联结 中 包括 的 一 张 表 的 所 有 值 ， 不 管 在 另 - : 张 表 中 是 否 有 匹配 值 。 并 联结 返回 包含 每 个 参 
与 联结 的 表 中 的 所 有 数据 。 

伐 套 子 查询 ， 即 多 个 SELECT 语句 代 套 在 一 个 查询 中 ， 对 于 比较 复杂 的 查询 情况 是 非常 有 
用 的 。 相 关子 查询 是 一 种 特殊 的 子 查询 形式 ， 在 处 理 内 部 查询 之 前 ， 需 要 一 个 来 源 于 外 部 查询 
的 值 。 其 他 的 子 查询 先 处 理 内 部 查询 ， 返 回 结果 给 下 一 个 外 部 查询 ， 然 后 再 处 理 外 部 查询 。 

其 他 的 高 级 SQL 技 术 包 括 候 入 式 SQL、 触 发 器 和 例 程 的 使 用 。SQL 可 以 包含 在 许多 用 第 三 代 
语言 编写 的 程序 中 ， 如 用 COBOL、C、Fortran 和 Ada 等 编写 的 程序 。 使 用 修 入 式 SQL 训 以 开发 更 
加 灵活 的 接 日 ,改善 系 统 性 能 ， 以 及 加 强 数据 库 的 安全 性 。 在 插入 、 更 新 和 删除 记录 有 时， 自动 
运行 的 用 户 自 定义 函数 称 为 触发 器 。 过 程 也 是 一 种 用 户 定义 的 代码 模块 ， 它 通过 调用 来 执行 。 

任 SQL-99 的 一 个 修 止 案 中 提议 加 入 一 系列 分 析 函 数 。 扩 展 后 的 SQL-99 将 使 数据 库 具有 更 
加 完整 的 计算 能 力 ， 同 时 在 持久 化 存储 模块 (SQL/PSM ) 等 规格 说 明 中 增加 流程 控制 功能 。 
SQL/PSM 可 以 直接 使 用 SQL 数据 类 型 创建 应 用 程序 、 过 程 和 函数 。SQL-99 中 还 包括 了 可 以 调 
用 的 例 程 ， 如 触发 器 、 示 数 和 过 程 。 用 户 应 该 认识 到 这 些 功 能 已 经 作为 数据 库 厂商 自 定 义 的 扩 
展 存 在 ， 并 将 继续 存在 一 段 时 间 。 

动态 SQL 是 启用 Web 的 数据 库 中 必 不 可 少 的 一 部 分 ， 本 书 将 在 第 10 章 详细 讲述 这 部 分 内 容 。 
第 8 章 讲 述 了 SQL 的 一 些 复杂 的 功能 ， 并 且 引 导读 者 掌握 更 复杂 的 扩展 SQL 功能 开发 数据 库 应 
用 程序 的 方法 。 


本 章 复 习 
关键 术语 
相关 子 查 询 声 数 持久 化 存储 模块 (SQL/PSM ) 
动态 SQL 联结 过 程 
获 入 式 SQL 自然 联结 触发 器 
等 值 联结 外 联结 用 户 自 定义 数据 类 型 (UDT) 
复习 问题 
1. 给 出 下 列 术 语 的 定义 。 
a. 动态 SQL b. 相关 子 查询 
c. 仿 入 式 SQL d. 过 程 
e. 联结 f. 等 值 联结 
g. 自然 联结 h. 外 联结 
i. 函数 j. 持 和 久 化 存储 模块 
2. 匹配 下 列 术语 及 定义 。 


等 值 联结 a. 撤销 对 表 的 修改 
一 一 自然 联结 b. 用 户 自 定义 数据 类 型 
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外 联结 c.SQL-99 扩 展 

触发 器 d. 返回 所 有 指定 表 的 记录 

过程 e. 保存 完 余 的 列 

_ 和 嵌入 式 SQL f. 使 对 表 的 修改 永久 生效 

_  _UDT g. 在 宿主 语言 中 包含 SQL 语句 的 过 程 

_ COMMIT h. 在 运行 中 能 够 使 应 用 程序 产生 SQL 代码 的 过 程 
SQLPSM i 不 保存 元 余 的 列 

_ 动态 SQL j. 在 设 定 条 件 下 执行 的 SQL 语句 集合 

_ ROLLBACK k. 被 存储 和 命名 的 过 程 化 的 SQL 语句 集合 


人 


.在 什么 情况 下 可 以 使 用 外 联结 而 不 是 使 用 白 然 联结 ? 
. 解释 相关 子 查询 的 执行 顺序 。 
. 应 用 SQL 解释 下 面 的 陈述 : 任何 可 以 用 子 查询 方法 编写 的 查询 也 可 以 用 联结 方法 编写 ， 
但 反 过 来 不 可 以 。 

6. SQL 中 COMMIT 命 令 的 作用 是 什么 ”提交 和 业务 事务 的 相关 概念 之 间 有 何 关 系 (例如 顾 
客 订 单 的 项 目 或 开具 客户 发 货 单 ) ? 

7. 在 给 数据 库 编 写 触发 器 时 必须 非常 小 心 。 写 出 会 遇 到 的 一 些 问题 。 

8. 解释 定义 触发 器 的 代码 模块 的 结构 。 

9. UNION 子 句 在 什么 情况 下 使 用 ? 

10. 讨论 SQL-99 的 修正 案 1。 

11. 陈述 SQL/PSM 的 作用 。 

12. 列 出 SQL 例 程 的 四 条 优点 。 

13. 在 什么 情况 下 使 用 嵌入 式 SQL， 什 么 情况 二 使 用 动态 SQL? 
问题 和 练习 

问题 和 练习 1 ~ 5 基于 第 4 章 的 图 4-6 中 所 描述 的 ERD 进 行 回答 。 带 有 一 些 例子 数据 的 3NF 关 
系 在 图 8-8 中 重复 出 现 。 对 问题 1 ~ 5， 画 出 实例 图 ， 并 人 在 期 望 返回 的 结果 数据 上 做 标记 。 

1. 给 下 列 每 个 查询 编写 SQL 检索 命令 : 
. 显示 所 有 前 缀 为 ISM 的 课程 ID 和 课程 名 。 
. 显示 Berndt 教 授 有 资格 教授 的 课程 。 
.显示 一 个 班级 花 名 册 ， 包 括 所 有 选修 HSM 4212 的 2714 班 的 学 生 姓 名 。 

2. 编写 一 个 SQL 查 询 回 答 下 上 而 的 问题 ， 那些 教师 有 资格 教授 课程 ISM 3113? 

3. 编写 一 个 SQL 查询 回答 下 面 的 问题 : 是 否 有 教师 有 资格 教授 课程 ISM 3113， 但 没有 资格 
教授 课程 ISM 4930? 

4. 编写 SQL 和 查询 回答 下 面 的 问题 ， 在 2001 年 第 一 学 期 有 多 少 学 生 注册 了 2714 班 ”在 2001 年 
第 一 学 期 有 多 少 学 生 选 修了 ISM 3113? 

5. 编写 一 个 SQL 查询 回答 下 面 的 问题 : 在 2001 年 第 一 学 期 有 哪些 学 后 没有 选修 任何 课程 ? 

问题 和 练习 6 ~ 12 基 于 完整 的 松 谷 家 具 公 司 数据 库 来 回答 。 

6. 编写 一 个 SQL 命 令 显 示 订单 #1001 的 订单 号 、 顾 客 号 、 订 购 日 期 和 订购 的 产品 条 日 。 

7. 编写 一 个 SQL 命令 显示 订单 #1001 中 订购 的 每 一 项 产品 ， 包 括 其 标准 价格 和 订购 的 每 项 
产品 的 总 价 。 

8. 编写 一 个 SQL 命 令 计算 订单 #1001 的 总 价 。 

9. 编号 一 个 SQL 命令 找 出 所 有 还 没有 下 订单 的 顾客 。 


nn 心 


Tr 总 


© 





288 利 四 部 分 实 现 





STUDENT (STUDENT_ID, STUDENT_NAME) 





3TUDENT_ID | STUDENT NAME 


上 | 


| 





38214 Letersky 
54907 Altvater 
66324 Aiken 
70542 Marra 











FACULTY (FACULTY_ID, FACULTY_NAME) 





FACULTY ID | FACULTY NAME 





2143 Birkin 
3487 Berndt 
4756 Collins 





COURSE (COURSE 1D, COURSE_NAME) 





COURSE_ID COURSE NAME 





1 
ISM 3113 Syst Analysis 
ISM 3112 Syst Design 
ISM 4212 Database 

ISM 4930 Networking 











! 


IS_QUALIFIED (FACULTY_ID, COURSE_ID, DATE_QUALIFIED) 

















FACULTY_ID | COURSE _ ID | DATE QUALIFIED 
上 十 
2143 ISM 3112 9/1988 
2143 ISM 3113 9/1988 
3467 ISM 4212 9/1995 
3467 ISM 4930 9/1996 
4756 ISM 3113 9/1991 
4756 ISM 3112 9/1991 
| 














SECTION (SECTION ID, COURSE _ID) 











SECTION_ID | COURSE_ID 
| ] 
2712 ISM 3113 
2713 ISM 3113 
2714 ISM 4212 

1 2715 ISM 4930 











IS_REGISTERED (STUDENT _ID, SECTION ID, SEMESTER) 








STUDENT ID | SECTION_ID | SEMESTER 








38214 2714 
54907 2714 
54907 2715 
66324 2713 











图 8-8 班级 安排 关系 (没有 IS_ASSIGNED ) 
10. 编写 一 个 SQL 查询 以 产生 一 个 列表 ， 其 中 包括 所 有 的 产品 和 其 被 订购 的 次 数 。 
11. 编写 一 个 SQL 查询 显示 所 有 顾客 及 其 订单 的 顾客 号 、 客 户 名 和 订单 导 。 
12. 编写 一 个 SQL 查询 列 出 所 有 客户 订单 中 订购 数量 超过 该 种 产品 平均 订购 数量 的 订单 号 


和 订购 数量 (提示: 使 用 相关 子 查询 )。 


应 用 练习 


1. 在 Web 上 查找 一 些 讨论 SQL 标准 的 链接 。 
2. 比较 你 曾 使 用 的 两 个 版 本 的 SQL ， 如 微软 的 Access 和 Oracle 的 SQL *Plus。 指出 它们 在 使 
用 SQL 代码 方面 至 少 五 个 相同 之 处 和 三 个 不 同 之 处 。 并 考虑 它们 的 不 同 之 处 是 否 会 导致 结果 的 


不 同 。 
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进一步 阅读 
。American National Standards Institute. http:/www.ansi.org. 1996。( 关于 ANSI 协 会 和 最 新 
的 国际 标准 方面 的 信息 。) 
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源 中 列 出 的 站 点 。 
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项 目 案例 : 山 景 社区 医院 


使 用 第 7 章 中 为 山 景 社 区 医院 实现 的 SQL 数据 库 设计 米 完 成 后 面 的 项 目 问题 和 项 目 练习 。 
项 目 问题 
1) 你 将 导 用 什么 版 本 的 SQL 来 做 这 个 项 月 练习 ? 
2) 你 的 这 个 基于 SQL 的 DBMS 是 否 支 持 动态 SQL、 国 数 、 存 储 过 程 和 UDT? 
项 目 练习 
1) 现在 ， 用 你 的 样本 数据 编写 并 测试 一 些 查 询 。 编 写 在 第 8 章 中 所 前 述 的 更 复杂 的 查询 
a. 从 两 个 或 多 个 表 中 选择 信息 。 
b. 使 用 子 查询 语法 。 
c. 返 回 一 个 结果 表 ， 它 能 用 来 制作 一 个 医院 报表 ， 比 如 分 派 给 每 个 诊疗 中 心 的 护士 名 
单 。 
d. 使 用 UNION 语 句 。 
2) 编写 查询 来 完成 以 下 工作 (显示 你 感 必 趣 的 询 ): 
a. 对 某 个 医生 来 说 ， 这 位 医生 对 他 所 收治 入 院 的 每 个 病人 进行 了 哪些 治疗 ? 
b. 对 于 a 中 的 查询 ， 还 要 包括 那些 不 是 由 这 名 医生 收治 人 院 的 病人 。 
c. 对 每 个 病人 来 说 ， 治 疗 该 病人 的 医生 所 进行 的 平均 治疗 次 数 是 多 少 ? 
d. 对 每 个 护士 长 来 说 ， 在 由 该 护士 长 负责 的 诊疗 中 心 内 工作 的 所 有 员工 人 总 工作 时 间 是 
多 少 ? (以 小 时 计 ,) | 





第 9 草 客户 /服务 器 数据 库 环境 


9.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

。 定 义 下 列 这 些 关 键 术 语 : 客户 /服务 器 系统 、 文 件 服务 器 、 胖 客户 机 、 数 据 库 服 务 器 、 存 
储 过 程 、 三 层 体系 结构 、 首 客户 机 、 应 用 分 割 、 对 称 多 处 理 (SMP)、 大 规模 并 行 处 理 
(MPP) /无 共享 体系 结构 、 中 间 件 、 应 用 程序 接口 (API)、 按 例 查询 (QBE)、 开 放 数 据 
库 互 连 (ODBC) 标准 、Visual Basic 应 用 程序 (VBA) 以 及 事件 驱动 。 

。 列 举 与 其 他 计算 方法 相 比 ， 客 户 / 服 务 器 体系 结构 的 若干 主要 优点 。 

。 解 释 应 用 风 辑 的 个 组 件数 据 表示 服务 、 处 理 服务 以 及 存储 服务 。 

。 指 出 在 不 同 的 客户 /服务 器 体系 结构 中 划分 这 些 服务 的 可 能 性 范围 。 

“区 分 文件 服务 器 和 数据 库 服务 器 ， 以 及 = 导体 系 结构 和 n 层 体系 结构 。 

“描述 中 间 件 ， 并 解释 中 间 件 如 何 为 客户 /服务 器 体系 结构 提供 方便 。 

。 解释 QBE 接 11 的 功能 ， 它 与 微软 Access 2000 的 关系 以 及 它 与 SQL 相 比 有 哪些 优 缺 点 。 
“解释 如 何在 -- 个 使 用 ODBC 或 JDBC 的 客户 /服务 器 环境 中 把 外 部 数据 表 链 接 到 一 个 应 用 
程序 。 

* 解释 如 何在 Access 2000 中 使 用 VBA 来 建立 客户 端的 应 用 程序 。 


9.2 引言 


客户 /服务 器 系统 (client/server system) 是 在 一 个 连 网 的 环境 中 运行 的 ， 它 将 一 个 应 用 程 
序 在 前 端的 客户 端 和 后 端的 处 理 器 之 间 进 行 分 割 。_ 般 来 说 , 客户 端的 进程 要 求 拥有 某 些 资源 ， 
而 这 些 资源 则 是 由 服务 器 提供 给 客户 端的 。 客 户 端 和 服务 器 可 以 驻 留 在 同一 台 计算 机 上 ， 也 可 
以 驻 留 在 连 网 的 不 同 计算 机 上。 客户 端 和 服务 器 都 是 智能 的 和 可 编程 的 ， 这 样 就 可 以 结合 两 者 
的 计算 能 力 来 设计 有 效 和 实用 的 应 用 程序 。 

我 们 很 难 忽略 客户 /服务 器 应 用 程序 在 过 去 10 年 里 所 带 来 的 巨大 影响 。 个 人 计算 机 技术 的 
进步 ， 图 形 用 户 界面 (GUI) 的 迅速 发 展 ， 计 算 机 连 网 以 及 通信 等 都 已 经 完全 改变 了 企业 使 用 
计算 系统 来 满足 日 益 苛刻 的 应 用 需求 的 方式 。 电 子 商务 要 求 客户 端的 浏览 器 能 够 存 取 附 属 在 提 
供 实时 信息 的 数据 库 上 的 动态 网 页 。 通 过 支持 工作 组 计算 的 网 络 链 接 起 来 的 个 人 计算 机 也 越 来 
越 常见 。 大 型 主机 上 的 应 用 程序 都 被 重新 编写 ， 以 便 它们 能 够 在 客户 /服务 器 环境 下 运行 ， 并 
充分 利用 个 人 计算 机 和 工作 站 的 网 络 在 成 本 上 的 明显 优势 适合 特定 企业 环境 的 战略 需求 都 能 
通过 客户 /服务 器 解决 方案 来 满足 ， 因 为 客户 /服务 器 解决 方案 提供 了 灵活 性 、 可 伸缩 性 ( 即 在 
不 必 重 新 设计 的 情况 下 升级 一 个 系统 的 能 力 ) 以 及 可 扩展 性 (定义 新 的 数据 类 型 和 操作 的 能 力 )， 
由 于 企业 在 其 运作 上 变 得 日 益 全 球 化 ， 所 以 他 们 必须 设计 分 布 式 的 系统 (这 方面 内 容 将 在 第 13 
章 并 述 )。 他 们 的 计划 中 经 常会 包括 客户 /服务 器 结构 。 

在 本 章 中 ， 我 们 要 回顾 - - 下 多 用 户 数据 库 管理 环境 的 发 展 ， 这 促进 了 不 同 的 数据 处 理 的 客 
门 /服务 器 战略 的 发 展 。 这 些 战 略 包括 基干 局 域 网 的 数据 库 管理 系统 ， 客 户 /服务 器 数据 库 管 理 系 
统 (包括 三 层 体系 结构 )， 并 行 计算 体系 结构 ， 因 特 网 和 企业 内 部 网 数据 库 管理 系统 以 及 中 间 件 。 
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数据 库 技术 的 发 展 趋势 的 是 由 各 种 新 的 机 会 和 竞争 压力 来 推动 的 。 从 某 种 意义 上 说 ， 网 络 
就 是 计算 机 ， 因 为 所 有 用 户 通过 网 络 驱动 器 共享 数据 ， 并 借助 因特网 存 取 他 们 所 需要 的 信息 和 
数据 。 公 司 的 重组 ， 包 括 合 并 和 收购 ， 使 得 有 必要 对 现 有 的 单机 应 用 程序 进行 连结 、 整 合 和 赫 
换 。 公 司 缩小 规模 的 一 个 后 果 就 是 ， 某 个 经 理会 拥有 更 多 的 控制 权 ， 因 而 有 必要 扩大 其 可 以 访 
问 的 数据 的 范围 。 应 用 程序 的 规模 也 不 断 缩 减 . 从 昂贵 的 大 型 主机 变 为 连 网 的 小 型 机 和 工作 站 ， 
它们 县 有 更 友好 的 用 户 界面 而 且 有 时 候 具 有 更 高 的 性 价 比 。 处 理 网 络 流量 成 为 开发 一 个 成 功 的 
客户 /服务 器 应 用 程序 的 关键 问题 ， 因 为 在 某 些 体系 结构 中 网 络 流量 可 能 会 过 高 ， 尤 其 是 对 于 
那些 将 关键 任务 的 应 用 程序 放置 在 一 个 分 布 式 环境 中 的 组 织 时 更 是 如 此 。 在 集中 的 和 非 集中 的 
系统 之 间 建立 良好 的 平衡 关系 是 当前 诸多 讨论 的 焦点 ， 因 为 这 些 组 织 力求 从 客户 /服务 器 和 基 
于 大 型 主机 的 数据 库 管 理 系 统 中 取得 最 大 的 效 盘 。 


9.3 客户 /服务 器 结构 


客户 /服务 器 环境 采用 局 域 网 来 支持 个 人 计算 机 的 网 络 ， 其 中 的 每 台 计 算 机 都 拥有 自己 的 
存储 设备 ， 它 们 也 能 共享 隶属 于 这 个 局 域 网 的 公共 设备 (比如 一 个 硬盘 或 者 打印 机 ) 和 软件 
(比如 一 个 数据 库 管理 系统 )。 局 域 网 上 的 每 台 PC 和 工作 站 之 间 的 距离 一 般 都 在 100 英 尺 以 内 ， 
整个 网 络 线 缆 的 长 度 不 应 该 超过 1 英里 。 至 少 应 该 将 一 台 PC 指 定 为 文件 服务 器 ， 在 该 文件 服务 
器 中 存储 共享 的 数据 库 。 一 个 数据 库 管理 系统 的 局 域 网 模块 会 添加 并 发 存 取 控制 ， 可 能 还 会 有 
额外 的 安全 特性 以 及 查询 或 翻译 队列 管理 ， 以 便 能 够 支持 一 个 共享 数据 库 的 多 个 用 户 进行 并 发 
存 取 。 

几 个 已 经 演化 发 展 的 客户 /服务 器 体系 结构 可 以 通过 查看 应 
用 逻辑 组 件 在 客户 端 和 服务 器 之 间 的 分 布 来 做 出 区 分 。 有 三 个 
应 用 逻辑 的 组 件 (参见 图 9-1)。 第 一 个 组 件 是 输入 /输出 (1O) 
组 件 或 者 表示 多 辑 组 件 。 这 个 组 件 人 负责 在 用 户 的 屏幕 或 者 其 他 
输出 设备 上 对 数据 进行 格式 化 或 进行 表示 ， 并 负责 管理 用 户 从 


键盘 或 其 他 输入 设备 上 的 输入 。 第 二 个 组 件 是 处 理 组 件 。 它 控 db 
制 数据 处 理 逻 辑 、 业 务 规则 逻辑 以 及 数据 管理 逻辑 。 数 据 处 理 业务 规则 


逻辑 包括 数据 确认 和 处 理 错误 识别 之 类 的 动作 。 在 数据 库 管理 
系统 层次 未 能 编码 的 业务 规则 可 以 在 处 理 组 件 中 进行 编码 。 数 
3 管理 逻辑 则 确定 处 理事 务 或 查询 所 必需 的 数据 。 第 三 个 组 件 
是 存储 组 件 ， 它 负责 从 与 应 用 程序 相连 的 物理 存储 设备 中 取出 
数据 或 向 其 中 存储 数据 。 一 个 数据 库 管理 系统 的 动作 就 在 存储 
组 件 罗 辑 中 发 生 。 

9.3.1 文件 服务 器 体系 结构 
第 一 个 开发 出 的 客户 /服务 器 结构 就 是 文件 服务 器 。 在 一 个 图 >! 应 用 程序 逻辑 组 件 
基本 的 文件 服务 器 环境 (参见 图 9-2) 中 ， 所 有 的 数据 操纵 都 在 需要 数据 的 工作 站 上 发 生 。 客 
户 端 处 理 表示 逻辑 、 处 理 逻 辑 以 及 绝 大 部 分 存储 逻辑 ( 那 一 部 分 与 某 个 数据 库 管理 系统 相 联系 )。 
一 个 或 多 个 文件 服务 器 连 在 局 域 网 上。 文件 服务 器 (file server) 是 管理 文件 操作 的 一 种 设备 ， 
它 由 每 个 连接 到 局 域 网 上 的 客户 端 PC 所 共享 。 这 些 文件 服务 器 可 作为 每 一 台 客户 端的 PC 的 一 
个 额外 的 硬盘 。 例 如 ， 你 的 个 人 电脑 可 能 会 识别 出 一 个 逻辑 F 驱 动 器 ， 它 实际 上 是 存储 在 局 域 
网 上 的 某 个 文件 服务 器 的 一 个 磁盘 卷 。 个 人 电脑 上 的 程序 通过 常见 的 路 径 指定 方法 (包括 这 个 
驱动 器 和 任何 相关 的 目录 以 及 文件 名 ) 查找 这 个 驱动 器 上 的 文件 。 有 了 文件 服务 器 后 ， 每 台 客 
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户 端的 个 人 计算 机 都 被 称 作 是 一 个 胖 客 户 端 (fat client)， 即 绝 大 部 分 处 理发 生 在 客户 端 而 不 是 









发 生 在 服务 器 的 机 器 。 
| | 客户 端 
Sl “ 处理/ 扫描 表 
“应 用 程序 
-用 户 界 而 
~ -数据 库 处 理 
客户 端 -产生 在 询 


。 处 理 完整 性 和 安全 性 
。 完 理 的 DBMS 


客户 端 









。 整 个 数据 文件 

文件 服务 器 Ue 

“文件 存储 | 

。 记 录 锁 状态 

。 使 客户 端 认为 文件 服务 器 是 另外 
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。 并 不 繁忙 

。 局域网 数据 传输 繁忙 


“请 求 锁定 数据 





。 请 求 数 据 








图 9-2 文件 服务 器 模式 


在 一 个 文件 服务 器 环境 中 ， 每 台 客 户 端 PC 被 授权 使 用 数据 库 管 理 系统 ( 当 革 个 数据 库 应 
用 程序 在 那 台 PC 上 运行 时 )。 因 此 ， 只 有 一 个 数据 库 ， 但 却 有 许多 同时 运行 的 该 数据 库 管理 系 
统 的 拷贝 ， 每 一 个 活动 的 PC 上 都 有 一 个 拷贝 。 文 件 服务 器 体系 结构 的 主要 特征 是 ， 所 有 的 数 
据 操纵 都 是 在 客户 端的 PC 上 执行 的 ， 而 不 是 在 文件 服务 器 上 执行 。 文 件 服务 器 只 是 作为 一 个 
共享 的 数据 存储 设备 而 存在 。 文 件 服务 器 上 的 软件 将 访问 需求 进行 排队 ， 这 相当 于 每 台 客户 端 
PC 上 的 应 用 程序 利用 该 台 PC 上 的 数据 库 管理 系统 的 拷贝 来 处 理 所 有 的 数据 管理 功能 。 例 如 ， 
在 这 种 环境 中 ， 数 据 安 全 性 检查 以 及 文件 和 记录 锁定 都 是 由 客户 端 PC 发 起 的 。 
9.3.2 文件 服务 器 的 局 限 性 

在 局 域 网 上 使 用 文件 服务 器 有 三 个 局 上限。 首先 ， 网 络 上 会 发 生 大 量 的 数据 移动 。 例 如 ， 当 
松 谷 家 具 公 司 内 一 台 客 户 端 PC 上 的 某 个 应 用 程序 想 要 存 取 橡 木 产品 时 ， 整 个 Product 表 就 要 传 
送 到 客户 端 PC， 然 后 在 客户 端 进行 扫描 以 找 出 所 需要 的 记录 。 因 此 ， 服 务 器 所 做 的 工作 甚 少 ， 
而 客户 端 则 忙于 完成 大 量 的 数据 操纵 ， 网 络 则 不 断 传送 着 大 量 的 数据 。 其 结果 就 是 ， 一 个 基于 
客户 机 的 局 域 网 会 将 大 量 的 负担 放 在 客户 端的 PC 上 来 执行 应 当 在 所 有 客户 机 上 执行 的 功能 ， 
并 且 会 产生 很 高 的 网 络 传输 负载 。 

第 二 ， 每 个 客户 端 工作 站 必须 为 一 个 完整 版 本 的 数据 库 管理 系统 会 占用 每 个 客户 端 工作 站 
的 内 存 。 这 意味 着 客户 端 PC 上 用 于 应 用 程序 的 内 存 就 会 减少 。 同 样 ， 增 加 PC 上 的 RAM 将 会 提 
高 性 能 ， 因 为 它 增加 了 在 处 理 一 个 事务 时 可 以 驻 留 在 PC 上 的 总 数据 容量 。 进 一 步 说 ， 由 于 客 
户 端 工作 站 承担 了 大 部 分 的 工作 ， 每 个 客户 机 性 能 必须 足够 强大 以 提供 合理 的 响应 时 间 。 相 比 
之 下 ,文件 服务 器 并 不 一 定 是 很 大 的 RAM， 也 不 一 定 是 一 台 性 能 非常 强大 的 PC， 因为 它 所 承 
担 的 工作 甚 少 。 
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第 三 ， 也 可 能 是 最 重要 的 一 点 ， 每 个 工作 站 上 的 数据 库 管理 系统 拷贝 必须 保证 共享 数据 库 
的 完整 性 。 此 外 ， 每 个 应 用 程序 必须 能 够 识别 诸如 锁 这 样 的 组 件 并 注意 启动 适当 的 锁 。 因此 ， 
应 用 程序 的 编写 者 必须 有 足够 的 经 验 ， 能 够 理解 在 一 个 多 用 户 数据 库 环 境 中 可 能 会 发 生 的 各 种 
微妙 状况 。 他 们 必须 知道 应 用 程序 如 何 与 数据 库 管理 系统 的 并 发 性 、 恢复 和 安全 控制 进行 互动 ， 
而 且 有 时 必须 将 这 样 的 控制 编写 进 他 们 的 应 用 程序 中 去 。 
9.3.3 数据 库 服 务 器 体系 结构 

客户 /服务 器 体系 结构 的 两 层 方法 仍然 遵循 了 文件 服务 器 的 方法 。 在 这 个 系统 中 ， 客 户 端 
工作 站 负责 管理 用 户 界 面 ， 包 括 表示 逻辑 、 数据 处 理 四 辑 以 及 业务 规则 逻辑 等 ， 而 数据 库 服务 
器 (database server) 则 负责 数据 的 存储 、 读 取 以 及 处 理 。 图 9-3 显 示 了 -个 典型 的 数据 库 服务 
器 体系 结构 。 由 于 数据 库 管 理 系统 放置 在 数据 库 服 务 融 上 ， 所 以 局 域 网 的 传输 流量 就 减少 了 ， 
因为 只 有 那些 符合 特定 标准 的 记录 才 会 被 传送 到 客户 端 工作 站 上 ， 而 不 是 将 全 部 数据 文件 都 传 
输 到 工作 站 。 有 人 把 这 种 集中 的 数据 库 管 理 系 统 功 能 称 为 后 端 功能 (back-end function )， 而 将 
客户 端 PC 上 的 应 用 程序 称 为 前 端 程序 (front-end program ) 。 








请 求 数据 
仅仅 是 选择 后 的 数据 

数据 库 

服务 器 





图 9-3 数据 库 服务 颖 体系 结构 (是 层 体 系 结构 ) 


将 数据 库 管理 系统 移 到 数据 库 服务 器 有 以 下 几 个 优势 。 利 用 这 种 体系 结构 ， 只 有 数据 库 服 
务 器 需要 拥有 足够 强大 的 处 理 能 力 来 处 理 数 据 库 ， 而 数据 库 是 存储 在 服务 器 上 而 不 是 存储 在 客 
户 机 上 。 因 此 ， 数 据 库 服务 器 可 以 进行 优化 以 实现 最 好 的 数据 库 处 理性 能 。 由 于 在 局 域 网 上 传 
送 的 数据 较 少 ， 通 信人 负载 就 减少 了 。 用 户 授权 、 完 整 性 检查 、 数 据 词 典 维护 以 及 查询 和 更 新 处 
理 都 在 同一 个 位 置 〈 即 数据 库 服 务 器 ) 上 执行 。 

采用 文件 服务 器 和 数据 库 服务 器 体系 结构 的 客户 /服务 器 的 项 目 一 般 是 部 门 级 的 应 用 ， 仅 
需 支 持 较 少 数量 的 用 户 。 这 类 应 用 并 不 是 关键 任务 的 ， 而 且 绝 大 部 分 都 是 成 功 的 ， 因 为 其 事务 
量 较 少 ， 直 接 的 可 用 性 并 不 是 关键 的 ， 安 全 性 也 并 不 是 最 受 关注 的 。 随 着 各 家 公司 致力 于 从 客 
户 / 服 务 器 项 目 中 获取 预期 的 收益 ， 比 如 获得 可 伸缩 性 、 灵 活性 以 及 较 低 的 成 本 ， 他 们 必须 为 
客户 /服务 器 体系 结构 找到 新 的 方法 。 
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存储 过 程 (stored procedure) 就 是 包含 在 数据 库 服务 器 中 能 够 实现 应 用 逻辑 的 代码 模块 ， 
它 的 使 用 推动 了 数据 库 服务 器 体系 结构 向 着 能 够 处 理 更 为 关键 的 业务 应 用 的 方向 发 展 
(Quinlan，1995 )。 正 如 Quinlan 所 指出 的 那样 ， 存 储 过 程 具 有 以 下 优势 : 

。 提 高 已 编译 的 SQL 语句 的 性 能 。 

。 随 着 处 理 任务 从 客户 端 移 到 服务 器 ,网络 流量 不 断 减少 

。 如果 存 取 的 是 存储 过 程 而 不 是 数据 ， 而 且 代 码 转移 到 了 服务 器 ， 不 会 让 最 终 用 户 直接 读 

取 ， 那 么 安全 性 就 会 提高 。 

。 数 据 完整 性 得 到 提高 ， 因 为 多 个 应 用 读 取 的 是 同一 个 存储 过 程 。 

* 存储 过 程 造 成 的 结果 是 使 用 较 瘦 的 客户 机 和 较 胖 的 服务 器 。 

但 是 ， 编 写 存 储 过 程 比 使 用 Visual Basie 政 才 Powerbuilder 来 改革 个 应 用 程序 要 花费 更 多 
的 时 间 。 而 且 ， 存 储 过 程 的 专 有 性 质 降 低 了 它们 的 可 移植 性 ， 会 造成 不 重新 编写 这 些 存 储 过 程 
就 无 法 改变 数据 库 管 理 系 统 。 此 外 ， 每 个 客户 机 必须 装载 在 该 客户 机 上 将 要 使 用 的 应 用 程序 。 
随 着 在 线 用 户 数量 的 增加 ， 其 性 能 就 会 下 降 。 将 某 个 应 用 程序 升级 就 需要 将 每 个 客户 端 都 分 别 
进行 升级 。 数 据 库 服 务 器 体系 结构 的 这 些 缺 陷 促 使 三 层 体系 结构 日 益 流 行 起 来 。 


9.4 三 层 体系 结构 


一 般 来 说 ， 一 个 三 层 体 系 结构 (three-tier architecture ) 就 是 在 前 面 已 经 提 及 的 客户 机 和 数据 
库 服务 器 两 层 之 外 再 包含 一 个 服务 器 层 (参见 图 9-4)。 这 样 的 配置 也 可 称 为 n 层 、 多 层 或 者 是 增 
蝇 型 客户 /服务 器 结构 。 三 层 体系 结构 中 额外 增加 的 服务 器 可 以 用 于 满足 不 同 的 目标 。 通 常 应 用 
程序 驻 留 在 这 个 额外 的 服务 器 上 ， 在 这 种 情况 下 该 服务 器 就 称 为 应 用 服务 器 。 这 个 额外 的 服务 
器 也 可 以 保存 一 个 本 地 的 数据 库 ， 而 另 一 个 服务 器 则 保存 企业 数据 库 。 以 上 每 一 种 配置 都 可 以 
称 为 三 层 体系 结构 ， 但 每 一 种 的 功能 有 所 不 同 ， 并 适用 于 各 种 不 同 的 情况 。 三 层 体系 结构 比 两 
层 结构 更 具 优势 ， 比 如 可 伸缩 性 、 灵 活性 、 性 能 以 及 可 重用 性 均 有 所 提高 ， 这 使 得 它 成 为 因 特 
网 应 用 和 以 网 络 为 中 心 的 信息 系统 的 流行 选择 方案 。 这 些 优势 我 们 将 在 下 面 的 内 容 中 详细 探讨 。 







应 用 程序 
服务 器 


数据 库 层 


数据 库 
服务 器 | 


图 9-4 三 层 体系 结构 
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在 某 些 三 层 体系 结构 中 ， 大 部 分 应 用 程序 代码 都 存储 在 应 用 服务 器 上 。 这 种 方法 所 产生 的 
好 处 与 在 两 层 结 构 中 把 存储 过 程 放 在 数据 库 服务 器 上 完全 相同 。 使 用 一 个 应 用 服务 器 还 能 通过 
使 用 真正 的 机 器 代码 提高 性 能 ， 加 强 应 用 程序 代码 向 其 他 平台 的 可 移植 性 ， 以 及 减少 对 诸如 
SQL/ PLUS 这 类 专 有 语言 的 依赖 性 《Quinian,1995 )。 在 许多 情况 下 ， 绝 大 多 数 的 业务 处 理发 生 
在 应 用 服务 器 上 ， 而 不 是 发 生 在 客户 端 工 作 站 或 者 数据 库 服务 器 上 ， 因 而 产生 了 瘦 客 户 机 
(thin client)。 在 客户 机 上 使 用 因特网 浏览 器 来 存 取 Web 网 页 是 瘦 客 户 机 体系 结构 的 一 种 最 好 的 
范例 。 现 在 ， 驻 留 在 某 个 服务 器 上 的 应 用 程序 就 在 那个 服务 器 上 执行 ， 而 不 用 下 载 到 客户 机 上 
的 方式 越 来 越 普遍 。 因此， 升级 应 用 程序 只 要 求 将 新 版 本 下 载 到 应 用 服务 器 上 即 可 ， 而 不 必 下 
载 到 客户 端的 工作 站 上 。 

三 层 体 系 结构 能 够 提供 以 下 好 处 (Thompson.,1997): 

“可 伸缩 性 ”三 层 体系 结构 比 两 层 结 构 具 有 更 大 的 可 伸缩 性 。 例 如 ， 通 过 使 用 一 个 事务 处 

理 (TP) 监控 器 来 减少 与 服务 器 的 连接 数目 ， 中 间 层 能 够 用 于 减少 数据 库 服务 器 上 的 负 

载 ， 并 可 以 增加 额外 的 应 用 服务 器 来 分 布 应 用 处 理 。TP 监 控 器 是 在 客户 机 和 服务 器 之 间 

控制 数据 传输 的 程序 ， 以 便 提供 一 种 一 致 的 环境 来 完成 联机 事务 处 理 (OLTP )。 

* 技术 上 的 灵活 性 ”尽管 触发 器 和 存储 过 程 都 需要 重新 进行 编写 ， 但 是 在 三 层 体系 结构 中 

改变 数据 库 管 理 系 统 的 引擎 更 为 容易 。 中 间 层 甚至 可 以 迁移 到 另 一 个 不 同 的 平台 上 。 简 

化 的 表示 服务 使 得 实现 各 种 所 期 望 的 界面 (比如 Web 浏 览 器 或 是 kiosk ) 变 得 更 加 容易 。 

“减少 长 期 成 本 ”在 中 间 层 使 用 商业 现 用 组 件 或 服务 能 够 降低 成 本 ， 因 为 能 够 在 一 个 应 用 

程序 中 替换 各 个 模块 ， 而 不 是 替换 整个 应 用 程序 。 

* 使 系统 与 业务 需求 更 好 地 配合 ”可 以 建立 新 的 模块 来 支持 特定 的 业务 需求 ， 而 不 用 建立 

更 为 通用 的 、 完 整 的 应 用 程序 。 

“可 以 改善 客户 服务 在 不 同 客户 机 上 的 多 种 界面 可 以 存 取 相 同 的 业务 进程 。 

“竞争 优势 ”通过 改动 小 的 代码 模块 而 不 是 整个 应 用 程序 ， 可 以 对 业务 变化 迅速 作出 反应 ， 

从 而 获取 竞争 上 的 优势 。 

“ 减少 风险 ” 此外， 迅速 实现 小 的 代码 模块 并 将 它们 与 从 供应 商 那里 购买 的 代码 结合 起 来 

的 能 力 降 低 了 从 事 大 规模 开发 项 目的 风险 。 

三 层 体系 结构 和 n 层 结构 是 客户 /服务 器 方法 的 最 新 发 展 。 向 一 个 三 层 体系 结构 或 者 更 复杂 
的 环境 迁移 所 涉及 的 挑战 包括 以 下 几 项 (Thompson,1997): 

“ 较 高 的 短期 成 本 ”实现 一 个 三 层 体 系 结构 要 求 表示 组 件 与 处 理 组 件 相 分 离 。 较 之 实现 一 

个 两 层 结构 而 言 ， 实 现 这 种 分 离 要 求 使 用 诸如 C 这 样 的 第 三 代 语 言 进行 更 多 的 编程 工作 。 

“ 工具 和 培训 ”由 于 三 层 体系 结构 是 相对 较 新 的 技术 ， 实 现 它们 的 工具 还 未 得 到 充分 的 开 

发 。 此 外 ， 因 为 培训 项 目 尚未 成 熟 ， 公 司 必须 开发 出 自主 实现 的 技巧 。 

“经验 同样 ,很 少 有 人 拥有 构建 三 层 体系 结构 的 经 验 。 

* 不 兼容 的 标准 ”对 于 事务 处 理 监控 器 来 说 ， 还 没有 提出 什么 标准 。 目 前 尚 不 清楚 会 采用 

针对 分 布 对 象 提出 的 若干 具有 竞争 性 的 标准 中 的 哪 一 个 。 

“缺少 与 中 间 层 服务 相 协 作 的 最 终 用 户 工具 目前 广泛 应 用 的 通用 工具 ， 比 如 最 终 用 户 电子 

数据 表 和 报告 工具 都 不 能 通过 中 间 层 服务 运行 。 这 个 问题 将 在 本 童 稍 后 有 关中 间 件 的 部 

分 中 作 更 详细 的 阐述 。 


9.5 分 割 一 个 应 用 
显然 ， 并 不 存在 一 种 最 优 的 客户 /服务 器 结构 能 够 解决 所 有 的 企业 问题 。 相 反 ， 客 户 /服务 
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器 体系 结构 中 国有 的 灵活 性 为 组 织 提供 了 定制 配置 以 适应 他 们 特定 的 处 理 需求 的 可 能 性 。 图 
9-1 描 述 了 必须 在 客户 端 和 服务 器 之 间 进行 分 配 的 计算 逻辑 。 表 示 风 辑 驻 留 在 客户 端 ， 客户 端 
是 用 户 与 系统 进行 交互 的 地 方 。 处 理 逻辑 可 以 在 客户 端 和 服务 器 之 间 进 行 分 割 ， 就 像 我 们 在 前 
面 讨论 文件 服务 器 、 两 层 和 三 层 客户 /服务 器 体系 结构 的 所 指出 的 那样 。 存 储 逻 辑 通常 驻 留 在 
数据 库 服务 器 ， 与 数据 的 物理 存储 位 置 相 邻 。 数 据 完整 性 控制 活动 ， 比 如 约束 检查 等 一 般 也 放 
在 那里 。 当 适当 的 条 件 得 到 满足 时 就 会 启动 的 触发 器 是 与 插入 、 修 改 、 更 新 和 删除 命令 相关 联 
的 。 由 于 这 些 命令 直接 影响 数据 ， 因 此 触发 器 通常 也 是 存储 在 数据 库 服务 器 上 的 。 直 接 使 用 数 
据 的 存储 过 程 存储 在 数据 库 服务 器 上 。 那 些 要 使 用 某 个 查询 结果 的 命令 可 以 存储 在 一 个 应 用 服 
务 器 或 是 客户 机 上 。 根 据 所 处 理 的 业务 问题 的 本 质 ， 也 可 以 不 遵守 这 些 一 般 法 则 ， 以 便 实现 最 
优 的 流量 吞吐 和 性 能 。 

应 用 分 割 (application partitioning) 有 助 于 实现 这 种 定制 。 它 能 让 开发 人 员 有 机 会 编写 将 
来 既 可 以 放 在 客户 端 工作 站 又 可 以 放 在 某 个 服务 器 上 的 应 用 程序 代码 ， 这 取决 于 哪个 位 置 能 提 
供 最 佳 的 性 能 。 没 有 必要 包含 放置 被 分 割 进程 的 代码 ， 也 不 必 编写 将 会 与 这 个 进程 建立 连接 的 
代码 。 这 些 活动 都 由 应 用 分 割 工具 来 处 理 。 

使 用 面向 对 象 编程 所 创建 的 对 象 非常 适合 于 应 用 分 割 。 程 序 员 对 每 个 对 象 的 内 容 拥有 很 大 
的 控制 权 ， 而 且 很 容易 将 用 户 界面 代码 、 业 务 规则 以 及 数据 分 隔 开 来 。 这 种 分 隔 支 持 着 今天 正 
在 述 速 发 展 的 n 层 系统 。 企 业 对 因特网 和 电子 商务 解决 方案 的 需求 强 有 力 地 推动 应 用 分 割 以 新 
的 方式 更 快 地 向 前 发 展 。Web 应 用 必须 是 多 层 的 和 分 割 的 。 它 们 需要 可 以 动态 组 装 起 来 的 组 件 ， 
并 在 浏览 器 要 求 时 调用 ， 而 且 它 们 必须 与 不 同 的 操作 系统 、 用 户 界面 和 数据 库 兼容 。 有 效 的 应 
用 分 割 在 Web 环 境 下 是 必 不 可 少 的 ， 这 样 才能 在 一 个 无 法 预期 的 分 布 式 环境 下 保持 良好 的 可 维 
护 性 、 数 据 完整 性 和 安全 性 的 同时 达到 所 期 望 的 性 能 。 

应 用 程序 代码 可 以 在 一 个 客户 端 工作 站 上 开发 和 测试 ， 而 分 割 该 代码 和 对 它 进行 放置 的 决 
定 可 以 在 以 后 做 出 。 这 种 能 力 会 有 助 于 提高 开发 人 员 的 生产 效率 。 应 用 模块 可 以 在 设计 阶段 的 
后 期 放置 在 某 个 客户 机 或 服务 器 上。 但是， 开发 人 员 必 须 了 解 每 个 进程 需要 如 何以 及 在 哪里 运 
行 ， 以 便 使 每 个 进程 或 事务 能 够 在 不 同 的 数据 库 和 平台 之 间 做 到 精确 同步 。 把 代码 放 在 应 用 服 
务 器 还 是 数据 库 服务 器 在 一 定 程度 上 取决 于 数据 库 管理 系统 的 功能 。 例 如 ， 对 于 一 个 通过 放置 
在 数据 库 服务 器 上 的 存储 过 程 和 触发 器 来 支持 静态 SQL (完全 预 编程 的 SQL 代 码 ) 的 数据 库 管 
理 系统 来 说 ， 如 果 动态 SQL 代码 〈 在 运行 时 创建 的 SQL 代码 ) 是 放置 在 应 用 服务 器 上 的 ， 那 么 
可 能 会 面临 一 种 性 能 消耗 。 每 条 动态 SQL 语句 在 被 处 理 时 会 在 数据 库 服务 器 上 产生 一 种 动态 的 
绑 定 〈 或 者 是 与 数据 库 对 象 的 链接 )。 性 能 的 影响 将 取决 于 动态 SQL 语句 使 用 的 频繁 程度 。 究 
竟 是 将 处 理 集中 于 应 用 服务 器 还 是 数据 库 服务 器 是 开发 人 员 必 须 做 出 的 一 个 决定 ， 开 发 人 员 了 
解 可 以 利用 的 硬件 环境 ， 硬 件 与 数据 库 管 理 系统 软件 的 交互 ， 以 及 应 用 程序 的 要 求 。 

也 可 以 把 事务 处 理 监控 器 增加 到 客户 /服务 器 系统 中 ， 以 便 提 高 性 能 。 只 要 多 个 应 用 服务 
器 和 数据 库 服务 器 可 供 利用 ，TP 监 控 器 就 能 平衡 工作 负载 ， 引 导 事务 转向 并 不 忙碌 的 服务 器 。 
TP 监控 器 在 分 布 式 环境 下 也 很 有 用 ， 在 分 布 式 环境 下 ， 来 自 一 个 工作 单元 的 分 布 式 事务 可 以 
在 异 构 环境 下 进行 管理 。 


9.6 大 型 主机 的 作用 


随 着 分 布 式 客户 /服务 器 系统 以 及 PC 计算 能 力 的 发 展 ， 大 型 主机 的 作用 在 过 去 十 年 里 变 得 
越 来 越 不 确定 。 正 如 上 文 所 提 到 的 那样 ， 十 年 前 驻 留 在 大 型 主机 系统 中 的 关键 任务 的 系统 趋向 
于 仍然 留 在 大 型 主机 系统 内 。 关 键 任务 程度 不 高 、 经 常 处 于 工作 组 层次 的 系统 已 经 被 人 们 使 用 
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客户 /服务 器 体系 结构 开发 出 来 。 客 户 / 服 务 器 体系 结构 的 流行 以 及 企业 在 更 为 复杂 的 环境 下 
(因为 他 们 的 思维 角度 更 加 宽泛 ， 更 加 全 球 化 ) 利用 分 布 式 环境 实现 更 有 效 的 计算 的 强烈 要 求 
导致 了 他 们 产生 这 样 的 期 望 ， 即 将 关键 任务 的 系统 从 大 型 主机 中 迁移 到 客户 /服务 器 体系 结构 
中 去 。 

但 是 ， 将 关键 任务 的 系统 从 传统 的 大 型 主机 遗留 系统 迁移 色 客 户 /服务 器 系统 是 极 具 挑 战 
性 的 工作 。 成 功 的 分 布 式 计算 取决 于 可 用 的 软件 分 配 、 有 效 的 性 能 管理 和 实际 使 用 的 系统 的 调 
整 、 已 经 确立 的 故障 排除 程序 以 及 主动 的 代码 管理 (Hurwitz.1996)。 一 些 企业 已 经 发 现 ， 一 且 
将 这 些 关 键 任务 的 应 用 程序 迁移 到 分 布 式 系统 ， 对 它们 进行 管理 就 变 得 复杂 得 多 。 在 一 个 分 布 
式 处 理 环 境 中 存在 的 软件 分 布 问题 如 下 所 示 : 

* 人 确定 哪些 代码 必须 放 企 哪个 工作 站 上， 而 哪些 代码 可 通过 某 个 服务 器 使 用 。 

“ 找 出 代码 与 其 他 应 用 程序 可 能 会 发 生 的 冲突 。 1 

* 人 确保 在 所 有 位 置 都 能 得 到 充足 的 资源 以 处 理 预期 的 负载 。 

除非 开发 人 员 能 够 预见 到 可 伸缩 性 问题 并 在 他 们 开发 代码 时 解决 它们 ， 否 则 将 关键 任务 的 
应 用 程序 迁移 到 客户 /服务 器 的 分 布 式 环境 就 可 能 会 在 从 规划 阶段 向 生产 过 滤 的 过 程 中 产生 严 
重 的 问题 。 这 就 减缓 了 关键 任务 的 客户 /服务 器 系统 的 开发 。 现 在 ， 因 特 网 的 应 用 要 求 使 用 大 
量 互 操作 的 应 用 程序 。 排 除 这 种 交互 中 的 故障 是 很 困难 的 ， 而 且 许 多 组 织 并 不 希望 进行 这 样 的 
故障 排除 。 组 件 库 〈 共 享 应 用 模块 的 文件 ) 使 用 的 增加 会 加 大 对 管理 相互 依赖 性 的 需要 ， 而 这 
种 相互 依赖 性 随 着 组 件 库 在 应 用 程序 之 间 的 共享 将 会 不 可 避免 地 扩大 。 

支持 分 布 式 环境 是 一 项 非常 复杂 的 任务 。 了 解 不 同位 置 的 环境 的 动态 状况 以 及 创建 一 个 分 
布 式 的 计算 网 络 是 非常 复杂 的 。 管 理 分 布 式 计算 环境 的 困难 促使 IT 经 理 们 重新 考虑 推动 关键 任 
务 的 系统 向 客户 /服务 器 解决 方案 的 迁移 。 功 能 强大 的 并 行 处 理 设备 (在 下 一 节 中 进行 探讨 ) 
正在 变 得 越 来 越 容易 使 用 ， 因 此 ， 集 中 使 用 某 个 应 用 或 数据 库 服务 器 更 具 吸 引力 。 

将 复杂 的 、 关 键 任务 的 应 用 程序 向 一 种 使 用 客户 /服务 器 结构 的 分 布 式 环境 迁移 的 困难 已 经 
令 许多 IT 经 理 们 感到 钥 责 ， 而 且 有 些 人 已 经 完全 放弃 了 客户 /服务 器 的 改革 ， 退 回 到 大 型 主机 的 
环境 中 去 。 但 是 ， 我 们 期 望 每 个 组 织 在 大 型 主机 和 客户 /服务 器 平台 、 在 集中 的 和 分 布 的 解决 方 
案 之 间 实 现 某 种 平衡 ， 即 完全 根据 其 数据 的 性 质 以 及 这 些 数据 的 企业 用 户 的 位 置 来 作出 定制 。 
正如 Hurwitz (1996) 所 建议 的 那样 ， 不 需要 经 常 移动 的 数据 可 以 集中 在 一 台大 型 主机 上 面 。 用 
户 需要 频繁 存 取 的 数据 、 复 杂 的 图 形 以 及 用 户 界面 应 当 尽 可 能 放 在 接近 用 户 工作 站 的 地 方 。 

企业 资源 规划 (ERP) 系统 已 经 面临 着 诸多 挑战 。 在 20 世 纪 90 年 代 ， 诸 如 SAP、Baan、 
Oracle 以 及 J.D. Edwards 等 公司 开发 的 ERP 系 统 说 服 了 那些 处 理 大 量 数据 的 公司 ， 购 买 集成 的 财 
务 、 人 力 资源 、 制 造 和 采购 系统 将 会 更 有 效率 、 更 具 性 价 比 。 转 而 使 用 一 个 已 解决 Y2K 问 题 的 
应 用 程序 套件 要 比重 新 编写 几 百 万 行 现 有 应 用 程序 的 代码 对 企业 来 说 更 具有 吸引 力 。 但 是 ， 
ERP 系 统 被 开发 成 严格 控制 的 封闭 系统 。 整 合 遗留 的 系统 (组 织 的 历史 数据 都 保存 在 那里 ， 而 
且 通 常 是 在 大 型 主机 上 ) 是 开发 人 员 所 面临 的 挑战 之 一 。 现 在 到 了 21 世 纪 ， 人 们 的 注意 力 已 经 
转向 实现 更 有 效 的 供应 链 管理 、 客 户 关系 管理 (CRM) 以 及 通过 电子 商务 解决 方案 进行 B2B 的 
采购 方面 。ERP 系 统 为 公司 的 内 部 管理 需要 建立 了 一 个 集成 的 基础 设施 ， 但 它们 还 必须 具有 电 
子 商务 的 功能 。 经 典 的 ERP 系 统 被 重新 构建 和 定位 ， 以 便 能 在 更 为 分 布 和 灵活 的 环境 中 进行 竞 
争 。 此 时 ， 就 无 法 预测 ERP 系 统 将 会 如 何 进展 了 。 


9.7 使 用 并 行 计 算 机 体系 结构 
组 织 从 关键 任务 的 应 用 程序 向 客户 /服务 器 体系 结构 迁移 的 尝试 ， 包 括 建立 能 够 处 理 比 最 
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初 的 客户 /服务 器 项 目 更 大 规模 的 数据 库 的 系统 。 涉及 超大 规模 数据 库 (VLDB ) 的 项 目 已 经 从 
使 用 并 行 计算 机 体系 结构 中 获 益 。 事 实 上 ， 有 些 项 目 之 所 以 可 能 仅仅 是 因为 数据 库 的 并 行 处 理 
给 出 了 一 个 可 以 接受 的 快速 响应 时 间 。 数据 仓库 已 经 使 用 并 行 性 通过 在 多 线程 环境 下 的 多 个 并 
不 昂贵 的 服务 器 上 来 实现 更 有 效 的 数据 提取 、 转 换 和 装载 。 

处 理 高 事务 量 、 复 杂 查 询 以 及 新 的 数据 类 型 的 能 力 在 许多 单 处 理 器 环境 下 已 经 证 实 是 有 问 
题 的 (DeWitt and Gray, 1992)。 但 是 ，RDBMS 和 SQL 语 言 以 两 种 方式 帮助 实现 了 一 个 并 行 的 
环境 (Ferguson,1994): 

1) 在 大 多 数 查 询 中 ，SQL 充 当 一 种 非 过 程 性 的 集合 处 理 语言 。 因 此 ， 查询 可 以 划分 成 许多 
部 分 ， 其 中 每 一 部 分 都 能 同时 在 不 同 的 并 行 处 理 副 上 运行 。 

2) 多 重 查 询 可 以 在 并 行 处 理 器 上 以 并 行 方式 运行 (参见 图 9-5)。 

并 行 计算 机 体系 结构 的 有 效 利用 还 包括 培养 对 能 够 在 -种 并 行 服务 器 环境 中 加 以 利用 的 处 
理 能 力 的 认识 ， 而 不 只 是 把 顺序 算法 改变 为 并 行 算法 。 我 们 将 介绍 两 个 可 供 利用 的 多 处 理 器 硬 
件 体系 结构 ; 其 中 每 一 个 都 是 为 某 种 特定 的 处 理 而 加 以 优化 的 。 


查询 1 








站 查询 2 





a) 并 行事 务 
查询 3 子 查询 3a 
3 
* “ 子 查 询 3b 





b) 并 行 查询 
图 9-5 并 行事 务 和 查询 (改编 自 Ferguson，1994 ) 


9.7.1 多 处 理 器 硬件 结构 

紧密 耦合 的 多 处 理 器 系统 在 所 有 处 理 器 之 间 拥 有 一 个 共享 的 内 存 (参见 图 9-6)。 这 种 体系 
结构 通常 称 为 对 称 多 处 理 (Symmetric Multiprocessing，SMP)， 它 有 如 下 所 述 的 优点 
(Ferguson,1994)。 首 先 ， 操 作 系统 的 一 个 拷贝 驻 留 在 共享 的 内 存 中 ， 因 而 可 以 由 所 有 处 理 器 共 
享 。 操 作 系 统 必须 可 以 在 这 样 一 种 共享 的 环境 中 运行 ， 这 样 它 就 能 让 自己 的 各 个 部 分 并 行 地 在 
任何 一 个 处 理 器 上 运行 ， 而 不 会 使 其 中 某 个 处 理 器 比 其 他 处 理 器 使 用 得 更 为 频繁 。 

第 二 个 优点 在 于 ， 与 单 处 理 器 系统 相 比 ， 瓶 颈 问 题 得 到 了 减轻 ， 因 为 在 对 称 多 处 理 环境 中 
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的 所 有 处 理 器 共同 分 享 所 有 的 任务 。 但 是 ， 当 进入 共享 内 存 的 请 求 流量 较 大 时 ， 即 便 是 对 称 多 
处 理 系统 也 会 出 现 MO 瓶 颈 。 为 每 个 处 理 器 配备 属于 它 自己 的 高 速 缓存 可 以 减轻 IO 瓶颈 。 然 后 ， 
通过 重新 激活 正在 等 待 的 事务 在 开始 处 理 它 的 处 理 器 上 运行 ， 就 有 可 能 减少 对 共享 内 存 的 请 求 
量 。 这 能 够 更 快 地 重新 激活 事务 ， 并 且 对 共享 内 存 的 请 求 更 少 ， 并 且 有 可 能 利用 与 该 事务 有 关 
的 、 仍 然 保存 在 特定 处 理 器 的 内 存 高 速 缓 冲 中 的 可 变 信息 (Ferguson，1994)。 





其 至 
内 存 








情况 来 说 是 非常 有 用 的 。 所 要 处 理 的 问题 包括 共享 内 存 发 生 争 用 的 可 能 性 ， 为 了 将 数据 取 回 到 
共享 内 存 所 需 的 带宽 宽度 ， 以 及 在 单个 失败 点 的 所 有 内 存 的 位 置 。 随 着 将 多 个 处 理 器 加 入 到 一 
个 共享 内 存 环境 中 ，LIO 争 用 问题 是 很 可 能 发 生 的 。 

与 SMP 结 构 相 比 ， 松 散 耦 合体 系 结构 (参见 图 9-7， 该 结构 又 称 为 大 规模 并 行 处 理 (MPP) 
体系 结构 或 无 共享 体系 结构 ) 可 以 为 每 个 CPU 设置 其 专用 的 内 存 。 每 个 节点 可 以 是 一 个 单 处 理 
器 或 多 处 理 器 。 因 此 ，MPP 系 统 要 求 在 每 个 专用 的 内 存 中 安装 一 份 操作 系统 的 拷贝 。 由 于 在 各 
处 理 器 之 间 没 有 什么 资源 需要 共享 ， 所 以 在 SMP 系 统 中 会 发 生 的 内 存 和 争 用 问题 则 不 大 可 能 发 生 
在 MPP 中 ， 而 且 在 单独 的 单元 内 可 以 增加 节点 ( 即 另 一 个 处 理 器 和 专用 的 内 存 )。 这 种 线性 的 
可 升级 性 使 得 企业 能 够 以 较 低 的 成 本 实现 并 行 处 理 ， 并 在 需要 时 小 规模 地 增加 处 理 功 能 。 这 种 
可 伸缩 性 在 动态 的 业务 环境 中 创造 了 一 个 更 加 容易 管理 的 系统 ， 而 数据 仓库 正在 这 种 环境 中 迅 
速 地 以 指数 速度 增长 。 通 过 在 多 个 处 理 器 之 间 传 递 消 息 来 实现 并 行 性 ， 这 种 系统 能 够 分 割 大 型 
的 任务 并 将 分 割 后 的 任务 分 布 在 多 个 处 理 器 上 。 事 实 上 ， 正 是 那些 拥有 大 型 任务 的 应 用 程序 能 
够 从 分 割 任 务 和 同时 运行 中 获得 好 处 ， 这 些 都 是 MPP 结 构 最 适合 的 ， 而 不 是 那些 能 够 从 闪 享 内 
存 的 使 用 中 获得 好 处 的 应 用 程序 。 有 很 多 MPP 技 术 的 开发 活动 ， 而 ITBM、NCR 、 英 特 尔 、 
Oracle、DEC ( 康 柏 公司 的 分 公司 )、 惠 普 、Encore、Silicon Graphics 以 及 其 他 一 些 公司 目 前 都 
致力 于 研究 和 开发 这 项 技术 。 由 于 并 行 处 理 系统 完全 不 同 于 传统 的 系统 ， 因 此 邯 虑 采用 并 行 系 
统 的 公司 有 必要 重新 评估 他 们 的 数据 库 和 应 用 程序 设计 、 功 能 规划 、 人 性 能 管理 以 及 可 操作 和 调 
度 程序 。 
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图 9-7 松散 耦合 多 处 理 器 结构 (改编 自 Ferguson,1994 ) 


9.7.2 与 业务 有 关 的 SMP 和 MPP 结 构 的 使 用 
许多 企业 都 存储 了 大 量 历史 数据 ， 他 们 急于 利用 这 些 数 据 ， 尤 其 是 有 关 其 业务 诸多 方面 的 
有 价值 信息 ， 包 括 客户 、 产 品 、 库 存 和 销售 等 。 以 前 ， 公 司 还 并 不 拥有 足够 的 计算 能 力 来 利用 
这 些 存储 的 数据 (Rudin, 1995 )。 但 是 现在 ， 并 行 处 理 使 得 企业 通过 开发 数据 仓库 和 数据 集 市 来 
分 析 这 些 庞大 的 历史 数据 。 并 行 处 理 能 力 的 出 现 为 开发 数据 仓库 莫 定 了 基础 ， 关 于 数据 仓库 我 
们 将 在 第 11 章 再 讨论 。 有 大 量 销售 数据 需要 进行 分 析 的 零售 企业 已 经 开始 利用 并 行 处 理 系统 。 
企业 在 采用 SMP 或 MPP 系 统 之 前 应 该 考虑 以 下 一 些 因素 (Rudin, 1995 )。 
。 数 据 分 析 需 求 并 行 系统 特别 适合 解决 涉及 处 理 大 量 数 据 (250GB 或 更 大 )、 执 行 复 杂 查 
询 的 问题 或 者 处 理 同 时 有 大 量 用 户 使 用 的 数据 。 这 些 问 题 只 有 在 它们 对 企业 具有 战略 意 
义 的 情况 下 才 应 当 加 以 解决 ， 否 则 重大 的 硬件 成 本 、 软 件 开 发 成 本 以 及 再 培训 成 本 对 组 
织 来 说 都 是 不 值得 付出 的 。 例 如 ， 零 售 应 用 程序 对 零售 商 来 说 具有 战略 性 的 价值 。 一 个 
很 好 的 例子 就 是 卡特 琳 娜 营销 公司 的 营销 一 篮子 分 析 系统 ， 它 不 仅 能 跟踪 顾客 购买 了 哪 
些 产品 ， 还 能 跟踪 顾客 会 同时 购买 哪些 类 别 的 产品 。 零 售 商 可 以 利用 这 类 应 用 程序 得 到 
的 结果 来 安排 针对 相关 产品 的 协同 促销 ， 分 配 货架 空间 和 布置 ， 以 及 进行 合理 定价 。 
“成 本 判定 要 记 住 并 行 系统 趋向 于 补充 而 不 是 取代 现 有 的 操作 系统 。 企 业 使 用 并 行 系统 
是 为 了 增加 收入 而 不 是 减少 成 本 。 因 此 ， 传 统 的 成 本 判定 过 程 可 能 并 不 适合 。 由 于 许多 
应 用 程序 用 来 改善 一 个 企业 的 营销 战略 ， 因 而 把 并 行 系统 当 作 一 种 对 营销 能 力 的 投资 是 
恰当 的 。 
。 传统 的 技术 如果 所 提议 的 应 用 程序 能 够 用 传统 的 、 现 有 的 技术 在 企业 内 实现 ， 那 么 继 
续 使 用 原 有 的 技术 是 比较 可 行 的 。MPP 系 统 还 远 没 有 成 熟 ， 实 现 它们 对 任何 企业 都 是 一 
种 挑战 。 因 此 ， 即 使 你 肯定 并 行 处 理 能 够 解决 企业 想 要 解决 的 问题 时 ， 仍 然 应 当 进 行 一 
次 更 成 熟 的 技术 可 行 性 分 析 。 在 某 种 单 处 理 器 环境 下 进行 并 行 处 理 是 一 种 较 好 的 问题 解 
决 方案 ， 但 在 采用 某 种 并 行 处 理 方案 之 前 仍然 应 当先 确定 是 否 可 以 利用 传统 的 技术 来 实 
现 ， 在 无 法 利用 传统 技术 的 情况 下 再 利用 并 行 处 理 。 
数据 仓库 和 数据 挖掘 应 用 程序 运用 联结 和 集合 操作 ， 处 理 存 取 大 量 数据 和 元 数据 的 查询 。 
这 些 查 询 涉 及 许多 1/O 操 作 ， 并 有 可 能 产生 相当 大 的 中 间 结 果 集 (Frazer, 1998 )。 目 前 ， 还 没有 
规模 足够 大 的 对 象 /关系 型 (O/R) 数据 库 可 当 作 VLDB 系 统 ( 可 参见 附录 DD 来 学 习 对 象 /关系 型 
数据 库 )。 但 是 ， 随 着 对 象 /关系 技术 越 来 越 成 熟 ， 人 们 期 望 用 它 来 处 理 至 少 与 目前 的 关系 实现 
方案 相同 规模 的 数据 库 ， 其 中 一 部 分 原因 是 对 象 /关系 型 数据 库 能 够 处 理 存储 容量 大 得 多 的 新 
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的 数据 类 型 。 对 象 /关系 型 数据 库 将 处 理 新 的 数据 类 型 之 间 实例 之 间 的 复杂 关系 ， 这 种 关系 已 
经 超出 了 关系 模式 那 种 简单 的 横行 纵 列 结构 。 并 行 处 理 方法 会 使 这 些 结构 都 成 为 可 能 。 


9.8 使 用 中 间 件 


中 间 件 经 常 作为 各 种 客户 /服务 器 应 用 程序 的 粘 合剂 。 这 个 术语 经 常用 来 撕 述 在 n 层 体系 结 
构 中 PC 客户 机 与 关系 数据 库 之 间 的 任何 软件 组 件 、 简 单 地 说 ， 中 间 件 (middleware) 就 是 某 种 
能 够 让 一 个 应 用 程序 与 其 他 软件 进行 互 操作 ， 而 不 要 求 用 户 了 解 和 编码 实现 这 种 互 操 作 性 的 低 
层 操作 〈Hurwitz, 1998 )。 中 间 件 已 经 存在 了 儿 十 年 ， 例 如 IBM 公 司 的 事务 处 理 中 间 件 CICS， 
以 及 BEA System 公 司 用 于 UNIX 的 Tuxedo。 客 户 / 服 务 器 技术 的 出 现 以 及 现在 面向 Web 的 发 展 刺 
激 了 新 型 的 商用 中 间 件 的 开发 。 当 然 ， 开 发 通用 的 中 间 件 ， 即 一 种 能 够 集成 和 连接 任何 类 型 系 
统 的 神奇 软件 包 是 最 理想 的 。 但 在 目前 ， 这 样 -- 种 中 间 件 软件 包 并 不 存在 。 大 多 数 企业 使 用 车 
干 不 同 的 中 间 件 软件 包 ， 有 时 甚至 是 在 一 个 应 用 程序 内 使 用 不 同 的 软件 包 。 
另 一 个 需要 考虑 的 因素 是 所 涉及 的 通信 究竟 是 同步 的 还 是 异步 的 。 对 同步 系统 来 说 ， 提 出 
请 求 的 系统 实时 等 待 对 该 请 求 的 响应 。 一 个 出 纳 员 在 兑付 支票 前 检查 账户 余额 的 联机 银行 系统 
就 是 一 种 同步 系统 。 异 步 系 统 发 送 某 个 请 求 ， 但 并 不 实时 等 待 响 应 。 相 反 ， 响 应 只 有 当 它 接收 
到 时 才 会 作出 。 电 子 邮件 就 是 一 个 你 比较 熟悉 的 异步 系统 。 
Hurwitz (1998) 提出 了 一 种 包含 6 个 类 别 的 有 用 的 分 类 系统 ， 它 将 目前 存在 的 诸多 类 型 的 
中 间 件 进行 了 分 类 。 她 是 基于 可 伸缩 性 和 可 恢复 性 进行 分 类 的 : 
“ 异步 远程 过 程 调用 (RPC) ”客户 机 要 求 服务 ， 但 并 不 等 待 响应 。 它 一 般 会 与 服务 器 建立 
一 种 点 对 点 的 连接 ， 并 在 等 待 响 应 时 执行 其 他 处 理 。 如 果 失 去 连接 ， 客 户 机 必须 重新 建 
立 连接 并 再 次 发 送 服 务 请 求 。 这 种 类 型 的 中 间 件 具有 较 高 的 可 伸缩 性 ， 但 可 恢复 性 较 低 ， 
而 且 自 1998 年 以 后 它 已 经 在 很 大 程度 上 被 同步 RPC 所 取代 。 
* 同步 RPC ”一 个 使 用 同步 RPC 的 分 布 式 程序 会 调用 不 同 计算 机 上 可 利用 的 服务 。 这 种 中 
间 件 使 用 方便 ， 不 用 承担 编写 一 个 RPC 通 常 必 不 可 少 的 详细 编码 工作 。 其 例子 包括 微软 
公司 的 Transaction Server 和 IBM 的 CICS 。 Java 中 和 RPC 功 能 相当 的 方法 就 是 远程 方法 调 
用 (RMI ) 。 
“ 发表/ 订阅 这 种 类 型 的 中 间 件 对 动作 进行 监控 并 把 信息 送 到 订阅 者 那里 。 它 是 异步 的 ， 
也 就 是 说 客户 端 ( 即 订阅 者 ) 在 接收 服务 器 的 通知 之 间 可 执行 其 他 动作 。 订 阅 者 通知 
信息 的 发 表 者 它 准 备 接收 ， 而 当 某 个 包含 这 种 信息 的 事件 发 生 时 ， 信 息 就 被 发 送 至 订 
阅 者 并 由 它 选 择 是 否 接收 这 个 信息 。 例 如 ， 你 可 以 在 电子 书店 中 输入 你 所 感 愉 趣 的 站 
名 的 关键 字 。 只 要 该 书店 增加 了 一 本 书 名 包含 你 所 输入 的 关键 字 的 图 书 ， 有 关 该 图 书 
的 信息 就 会 自动 地 转发 给 你 。 这 种 类 型 的 中 间 件 在 监控 特定 事件 发 生 时 需要 采取 行动 
的 情况 时 非常 有 用 。 
* 面向 消息 的 中 间 件 (MOM) MOM 同 样 也 是 一 种 异步 软件 ， 它 发 送 消息 (这些 消息 可 以 
收集 并 储存 起 来 ， 直 到 它们 被 执行 为 止 )， 而 客户 机 可 以 继续 执行 其 他 处 理 。 像 保 险 单 应 
用 这 样 的 工作 流 应 用 程序 通常 会 包含 多 个 处 理 步骤 ， 因 而 能 从 MOM 中 获得 好 处 。 存储 请 
求 的 队列 可 以 在 日 志 中 记录 下 来 ， 因 而 提供 了 某 种 程度 的 可 恢复 性 。 
。 对象 请 求 代理 (ORB ) 这 种 类 型 的 中 间 件 使 得 应 用 程序 可 以 在 一 个 面向 对 象 的 系统 中 
发 送 对 象 和 请 求 服 务 。ORB 跟 踪 每 个 对 象 的 位 置 ， 并 把 请 求 路 由 给 每 个 对 象 。 且 前 的 
ORB 是 同步 的 ， 但 异步 的 ORB 正 处 于 开发 过 程 中 。 
* 面向 SQL 的 数据 存 取 通过 网 络 将 应 用 程序 与 数据 库 连 接 起 来 是 通过 使 用 面向 SQL 的 数 
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据 存 取 中 间 件 来 实现 的 。 这 种 中 间 件 有 共有 将 一 般 的 SQL 翻译 成 数据 库 特定 的 SQL 的 能 

力 。 忆 经 开发 出 多 数据 库 访问 中 间 件 的 数据 库 供 应 商 和 公司 在 这 部 分 中 间 件 市 场 中 占 

据 主 导 地 位 。 

尽管 前 述 的 分 类 水 使 大 家 对 中 间 件 功能 有 了 基本 的 认识 ， 许 多 产品 综合 利用 了 以 上 多 种 功 
能 。 例 如 ， 面 向 SQL 和 RPC 的 中 间 件 增加 了 对 对 象 的 认识 ， 而 ORB 则 增加 了 事务 、 排 队 和 消息 
服务 。 对 象 事务 监控 器 应 该 很 快 就 能 面世 ， 它 承诺 将 结合 日 前 由 CORBA 或 DCOM 处 理 的 分 布 
式 对 象 功 能 和 为 应 用 程序 提供 事务 管理 并 有 助 于 减少 MO 眶 颈 的 事务 监控 器 功能 。 

在 客户 /服务 器 系统 中 ,面向 数据 库 的 中 间 件 为 访问 数据 库 提供 了 某 种 应 用 程序 接 fi (APT)。 
API 是 一 个 应 用 程序 用 来 指导 由 计算 机 的 操作 系统 提供 的 程序 执行 的 例 程 集合 。 例 如 ， 在 访问 
个 数据 库 时 ， 一 个 API 会 调用 将 SQL 命令 从 前 端的 客户 机 应 用 程序 路 由 至 数据 座 服务 器 的 库 
例 程 。 一 个 API 可 以 与 现 有 的 前 端 软件 〈 如 某 种 第 二 代 语 言 或 定制 报告 生成 器 ) 协同 工作 ， 而 
且 它 可 以 包括 自己 的 建立 应 用 程序 的 机 制 。 当 芒 干 程序 开发 工具 都 存在 应 用 程序 接 中 时 ， 你 就 
拥有 相当 的 独立 性 在 最 方便 的 前 端 编 程 环境 中 开发 客户 机 的 应 用 程序 ， 并 仍然 从 某 个 公共 的 服 
务 器 数据 库 中 获取 数据 。 这 样 的 中 问 件 使 得 开发 人 员 可 以 把 -- 个 应 用 程序 轻而易举 地 链接 到 流 
行 的 数据 库 上 。 

开放 数据 库 互 连 (ODBC) 是 与 API 相 似 、 但 基于 Windows 的 客户 /服务 器 应 用 程序 。 它 对 
访问 关系 数据 最 为 有 用 ， 但 并 不 适用 于 访问 其 他 类 型 的 数据 ， 比 如 1ISAM 文 件 (LaRue,1997 )。 
即使 ODBC 是 难以 编程 和 实现 的 ， 但 它 仍然 得 到 了 人 们 的 接受 ， 因 为 它 使 得 程序 员 能 够 与 任何 
销售 商 的 数据 库 建立 链接 ， 而 不 必 学 会 该 数据 库 使 用 的 专用 代码 。 关 于 ODBC 和 建立 因特网 数 
据 库 的 连接 的 更 详细 讨论 ， 请 参见 第 10 章 。 微 软 公 司 的 OLE-DB 通 过 提供 对 多 个 数据 库 的 单个 
存 取 点 为 DODBC 标 准 增加 了 价值 (Linthicum,1997)。 微 软 正在 计划 让 OLE-DB 成 为 一 个 通用 的 
数据 访问 标准 ， 并 增加 了 用 于 数据 挖 据 应 用 和 OLAP 的 OLE-DB。 在 向 客户 /服务 器 迁移 的 同时 
访问 遗留 数据 可 以 通过 诸如 EDA/SQL 这 样 的 产品 来 实现 ， 它 正 试 图 支持 许多 不 同 的 操作 系统 、 
网 络 和 数据 库 。 

Java 数 据 库 互 连 (JDBC) 类 可 用 来 帮助 一 个 applet 访 问 任何 数量 的 数据 库 ， 而 不 必 了 解 每 
个 数据 库 的 本 质 特性 。JDBC 为 Java 开 发 定义 了 一 个 调用 层次 接口 (CLI)， 并 借用 了 ODBC 的 
协议 。 建 立 一 种 通用 语言 来 界定 不 同 组 件 之 间 的 接口 并 且 建 立 一 种 协调 的 机 制 将 促进 通用 中 间 
件 的 开发 (Keuffelj,1997)。1989 年 成 立 的 对 象 管理 组 织 (OMG ) 是 一 个 行业 联盟 ， 它 产生 了 
为 面向 对 象 的 通用 中 间 件 确立 规范 的 公用 对 象 请 求 代理 体系 结构 (CORBA )。 微 软 公司 则 开发 
了 分 布 式 组 件 对 象 模型 (DCOM )， 但 CORBA 是 -一 个 更 为 强壮 的 规范 ， 因 为 它 已 经 用 来 处 理 许 
多 不 同 的 平台 。 两 个 标准 之 间 也 开始 实现 互 操 作 。 这 样 的 标准 在 Web 上 尤其 重要 ， 内 为 Web 上 
相互 连接 的 平台 是 截然 不 同 的 。 


9.9 建立 客户 /服务 器 的 安全 性 


客户 /服务 器 数据 库 计算 意味 着 存在 一 个 网 络 ， 它 将 客户 /服务 器 组 件 连接 起 来 。 在 这 种 分 
布 式 的 环境 中 ， 建 立 数据 库 的 安全 性 要 比 在 个 集中 式 环境 中 建立 安全 性 更 为 复杂 (可 参见 第 
12 章 了 解 对 数据 库 安全 性 的 更 详细 的 论述 )。 通 过 偷 听 、 未 经 授权 的 连接 或 者 对 网 络 上 传输 的 
音 息 包 进 行 示 经 授权 的 访问 ， 网 络 最 容易 受到 破坏 安全 性 的 攻击 。 因 此 ， 客 户 /服务 器 体系 结 
构 要 比 集中 式 系 统 更 易 受到 安全 性 威胁 。 

在 一 个 客户 /服务 器 环境 中 应 当 采 取 一 定 的 安全 措施 ， 其 中 不仅 应 包括 确保 所 有 系统 安全 
性 的 通用 措施 ， 而 且 还 应 包括 确保 更 为 分 布 化 的 客户 /服务 器 结构 环境 安全 性 的 措施 








(Bobrowski, 1994 ): 

* 系统 层次 的 口令 安全 用 户 名 和 口令 通常 用 于 人 在 用 户 准备 与 其 个 多 用 户 的 客户 /服务 器 系 
统 进行 连接 时 对 用 户 进行 识别 和 授权 。 安 全 标准 应 当 包 括 口 令 长 度 、 口 令 命名 规则 、 口 
令 改变 的 频 度 等 等 方面 的 指南 。 口 令 管理 机 制 应 当 作 为 网 络 和 操作 系统 的 一 部 分 。 

。 数据 库 层次 的 口令 安全 大 多 数 客 户 /服务 器 数据 库 管 理 系统 拥有 与 系统 层次 的 口令 安 
全 相 类 似 的 数据 库 层次 的 口令 安全 机 制 。 它 还 可 能 通过 由 操作 系统 认证 能 力 提供 的 认 
证 信息 。 利 用 通过 能 力 的 管理 要 更 容易 - - 些 ， 但 外 部 获得 数据 存 取 的 尝试 也 将 更 容易 
些 ， 因 为 使 用 通过 能 力 把 11 令 的 安全 层 从 两 个 减少 为 一 个 。 对 操作 系统 认证 的 依赖 不 
应 当 提 倡 。 

。 安 全 的 客户 /服务 器 通信 加 密 就 是 把 可 读数 据 (明文 ) 转换 为 不 可 读 的 ( 密 文 ) 数据 ， 
从 而 有 助 于 确保 安全 的 客户 /服务 器 通信 。 大 多 数 客户 机 发 送 数据 库 用 户 的 明文 口令 给 
数据 库 服务 器 。 诸 如 Oracle、Sybase 和 Inform 这 样 的 大 型 关系 数据 库 管理 系统 拥有 安全 
的 网 络 口令 传输 功能 。 对 网 络 上 传输 的 所 有 数据 进行 加 密 显然 是 人 们 期 望 的 ， 但 加 密 软 
件 的 成 本 是 很 高 的 。 加 密 还 会 对 性 能 造成 负面 影响 ， 因 为 需要 有 了 时间 来 对 数据 进行 加 密 
和 解密 。 

”支持 Web 的 数据 库 的 客户 /服务 器 安全 性 问题 

使 现 有 的 数据 通过 因特网 连接 让 浏览 者 进行 访问 的 Web 站 点 的 大 量 涌现 引起 了 新 的 问题 ， 
这 些 问题 不 只 是 在 前 一 节 所 述 的 传统 的 客户 /服务 器 安全 问题 。 某 个 数据 库 动 态 地 创建 网 页 时 
要 求 能 够 访问 数据 库 ， 而 如 果 数 据 库 没有 得 到 很 好 的 保护 ， 它 就 会 受到 用 户 由 于 不 恰当 访问 而 
造成 的 攻击 。 这 是 一 个 新 的 易 受 攻击 点 ， 而 原先 它 可 以 通过 严格 的 数据 库 访问 授权 方案 或 是 专 
门 的 客户 端 访问 软件 来 避免 。 

如 果 一 个 组 织 仅 仅 是 需要 静态 的 HTML 页 面 ， 那 么 必须 对 存储 在 Web 服务 器 上 的 HTML 文 
件 建立 保护 。 一 个 静态 web 页面 是 使 用 传统 的 客户 /服务 器 工具 ， 比 如 Visual Basic 或 者 
PowerBuilder 创 建 的 ， 因 此 它们 的 创建 可 以 通过 使 用 标准 的 数据 库 访问 控制 方法 来 加 以 控制 。 
如 采 某 些 装载 到 Web 服 务 器 的 HTML 文 件 有 一 定 的 机 密 性 ， 那 么 就 将 它们 放置 在 使 用 操作 系统 
安全 机 制 保护 的 目录 内 ， 或 者 它们 在 目录 内 是 可 读 的 但 并 不 对 外 发 布 。 因 此 ， 用 户 必 须知 道 准 
确 的 文件 名 才能 访问 这 个 机 密 的 HTML 页面 。 把 Web 服 务 器 隔离 开 来 并 限制 其 可 公开 浏览 的 
Web 页 面 内 容 是 常用 的 方法 。 机 窗 文件 可 以 保存 在 另 一 个 服务 器 上 ， 只 能 通过 企业 的 内 部 网 才 
能 访问 。 此 外 ， 如 果 有 些 用 户 不 应 该 访问 企业 内 部 网 上 存储 的 所 有 文件 ， 那 么 应 该 利用 上 面 所 
说 的 那些 安全 措施 。 用 户 认 证 安全 机 制 可 以 用 来 控制 对 机 密 文件 的 访问 。 

用 于 动态 网 页 创建 的 安全 措施 则 有 所 不 同 。 动 态 网 页 页 面 作为 一 个 模板 存储 ， 并 在 与 该 页 
面 有 关 的 查询 开始 运行 时 从 数据 库 插入 合适 和 当前 的 数据 。 这 意味 着 Web 服 务 器 必须 能 够 访问 
数据 库 。 为 了 正常 工作 ，、 连 接 通常 要 求 对 数据 库 拥 有 全 部 的 访问 权 。 因 此 ， 对 服务 器 采取 足够 
的 安全 性 措施 对 保护 数据 是 至 关 重 要 的 。 拥 有 数据 库 连 接 的 服务 器 在 物理 上 应 当 是 安全 的 ， 而 
程序 和 公共 网 关 接 口 (CGI) 脚本 的 执行 应 当 是 可 以 控制 的 。 

对 数据 的 访问 还 可 以 通过 另外 一 层 安全 手段 ， 即 用 户 认 证 安全 来 加 以 控制 。 使 用 HTML 的 
登录 表单 可 以 使 数据 库 管 理 员 确定 每 个 用 户 的 权限 。 每 次 会 话 可 通过 在 客户 端 存储 一 段 数据 
( 即 “cookie”) 来 进行 跟踪 。 这 些 信息 可 以 返回 给 服务 器 并 提供 有 关 登 录 会 话 的 信息 。 必须 利 
用 CGI 脚 本 或 其 他 手段 来 执行 必要 的 认证 例 程 。 

间 样 也 必须 建立 会 话 安全 性 以 确保 私有 的 数据 在 会 话 中 不 会 受到 破坏 ， 因为 信息 在 网 络 上 
进行 广播 以 供 某 台 机 器 接收 ， 因 而 也 就 有 可 能 受到 拦截 。 TCP/IP 并 不 是 一 个 非常 安全 的 协议 ， 
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而 前 面 所 述 的 客户 /服务 器 上 的 加 密 系统 就 是 必 不 可 少 的 。 许 多 因特网 系统 使 用 一 种 公共 密 钥 
和 秘密 密 钥 相 结合 的 加 密 方法 。 服 务 器 和 客户 机 都 能 用 他 们 的 私有 密 钥 加 密 一 个 秘密 密 钥 。 经 
过 加 密 的 数据 和 他 们 的 公共 密 钥 一 起 传送 ， 或 者 他 们 的 公共 密 钥 可 以 由 一 个 提供 这 种 密 钥 的 
Certificate Saver 保 存 。 许 多 开发 人 员 通 常用 安全 套 接 字 层 (SSL) 这 种 标准 的 加 密 方法 来 对 所 
有 在 一 次 会 话 中 客户 端 与 服务 器 之 间 传 输 的 数据 进行 加 密 。 以 https:/ 开 头 的 URL 就 在 传输 中 使 
用 SSL 。 

其 他 一 些 安全 措施 〈 如 数字 签名 、Kerberos 服 务 器 以 及 与 供应 商 相关 的 安全 措施 ) 将 在 第 
12 章 中 讨论 。 


9.10 客户 /服务 器 的 问题 


无 疑 ， 客 户 /服务 器 体系 结构 的 建立 已 经 影响 了 数据 库 的 计算 环境 。 但 是 ， 我 们 经 常会 听 
说 客户 /服务 器 的 实施 失败 以 及 用 户 对 此 大 失 所 望 。 为 了 获得 成 功 ， 客 户 /服务 器 项 目 必须 用 定 
义 良 好 的 技术 和 成 本 参数 来 解决 某 个 特定 的 业务 问题 。 某 些 领域 应 当 小 心地 加 以 处 理 ， 以 便 提 
高 构建 一 个 成 功 的 客户 /服务 器 应 用 的 机 会 (Linthicum.1996): 
* 准确 地 分 析 业 务 问题 ”和 其 他 计算 体系 结构 的 情况 一 样 ， 开 发 一 个 可 靠 的 应 用 程序 设计 
和 体系 结构 对 新 的 客户 /服务 器 系统 来 说 是 至 关 重 要 的 。 开 发 人 员 选 取 适 当 的 技术 ， 然 后 
开发 适合 该 技术 的 应 用 程序 的 趋势 很 明显 是 过 去 10 年 来 发 生 的 客户 /服务 器 环境 推动 的 。 
准确 定义 问题 的 范围 并 确定 需求 ， 然 后 运用 该 信息 来 选择 技术 是 更 加 恰当 的 。 
“ 详细 地 分 析 结 构 ”确定 客户 /服务 器 体系 结构 的 细节 也 是 同样 重要 的 。 建 立 一 个 客户 / 服 
务 器 解决 方案 包括 连接 许多 组 件 ， 让 这 些 组 件 协同 工作 可 能 有 一 定 的 难度 。 客 户 /服务 
器 计算 一 直 宣称 接受 开放 系统 方法 的 能 力 是 其 一 个 极 大 的 优点 ， 但 如 果 选 择 的 异 构 组 件 
很 难 连接 就 会 将 这 个 优点 变 成 缺点 。 除 了 指定 客户 端 工作 站 、 服 务 器 、 网 络 和 数据 库 管 
理 系 统 外 ， 分 析 员 还 应 当 确定 网 络 的 基础 结构 、 中 间 件 层 以 及 所 使 用 的 应 用 开发 工具 。 
在 每 一 个 结合 点 ， 分 析 员 都 应 当 采 取 措 施 确保 这 些 工 具 能 与 中 间 件 、 数 据 库 和 网 络 等 连 
接 起 来 。 
" 避免 工具 驱动 的 体系 结构 如 上 所 述 ， 要 在 选择 软件 工具 之 前 确定 项 目 要 求 而 不 是 先 选 择 
工具 再 确定 项 目 需求 。 首 先 选 择 一 个 工具 ， 然 后 运用 它 解决 问题 ， 这 种 做 法 的 风险 在 于 
问题 和 工具 之 间 的 配合 不 会 很 好 。 在 选择 工具 时 可 能 是 根据 设计 人 员 的 主观 想法 来 选择 
的 ， 而 不 是 根据 该 工具 的 恰当 功能 来 选择 的 。 
* 实现 恰当 的 可 伸缩 性 一 个 多 层 的 解决 方案 能 使 客户 /服务 器 系统 进行 适当 的 伸缩 以 满足 
不 同 数目 用 户 的 需求 ， 并 处 理 完 全 不 同 的 负载 。 但 多 层 解决 方案 显然 更 为 昂贵 ， 构 建 起 
来 也 更 为 困难 。 开 发 一 个 多 层 环境 的 工具 也 很 有 限 。 除 非 确 有 必要 ， 否 则 架构 师 应 当 避 
免 使 用 多 层 的 解决 方案 。 通常， 多 层 方案 在 并 发 用 户 超过 100 位 、 高 流量 的 事务 处 理 系统 
或 者 实时 处 理 的 环境 中 比较 适用 。 在 规模 较 小 的 、 事 务 量 不 多 的 环境 中 利用 传统 的 两 层 
系统 经 常会 更 有 效率 ， 尤 其 是 用 触发 器 和 过 程 来 管理 处 理 时 更 是 如 此 。 
“ 服务 的 恰当 配置 ”此 外 ， 仔 细 分 析 所 要 解决 的 业务 问题 在 决定 如 何 放置 处 理 服务 时 是 很 
重要 的 。 转 而 利用 瘦 客 户 机 和 胖 服 务 器 并 不 总 是 恰当 的 解决 方案 。 把 应 用 逻辑 转移 到 服 
务 器 从 而 创建 一 个 胖 服务 器 会 影响 容量 ， 因 为 最 终 用 户 都 要 使 用 现在 装载 于 服务 器 上 的 
应 用 程序 。 有 时 ， 把 应 用 程序 的 处 理 转 移 到 客户 端 可 以 实现 更 好 的 伸缩 性 。 胖 服务 器 的 
确 会 趋向 于 减少 网 络 负载 ， 因 为 处 理 在 接近 数据 的 地 方 发 生 ， 并 且 胖 服务 器 确实 减少 了 
对 功能 强大 的 客户 机 的 需要 。 充 分 理解 业务 问题 确实 有 助 于 架构 师 恰 当地 进行 逻辑 分 布 。 
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* 网 络 分 析 分布 式 系统 最 常见 的 瓶颈 仍然 是 网 络 。 畴 此、 架构 师 千 万 不 要 忽视 系统 必须 
使 用 的 网 络 带 宽 。 如 果 网 络 不 足以 处 理 必须 在 客户 端 和 服务 器 之 间 传 送 的 信息 量 ， 那 么 
响应 时 间 就 会 受到 很 大 影响 ， 而 系统 则 有 可 能 失败 。 

。 注意 隐蔽 的 成 本 客户 /服务 器 的 实现 问题 不 只 包括 上 面 列 出 的 分 析 、 开 发 以 及 体系 结构 
问题 (Atre,1995 )。 例 如 ， 准 备 使 用 现 有 硬件 、 网 络 、 操 作 系 统 和 数据 库 管理 系统 的 系 
统 经 常会 受到 集成 这 些 异 构 组 件 以 建立 客户 /服务 器 系统 的 复杂 性 的 阻碍 。 培 训 是 一 项 很 
可 观 的 反复 支出 的 成 本 ， 而 它 经 常会 被 忽视 。 若 环境 中 的 组 件 来 自 不 同 的 供应 商 ， 那 么 
其 复杂 性 会 带 来 扁 昂 的 成 本 。 

如 果 这 些 问 题 都 得 到 恰当 的 解决 ， 那 么 利用 客户 /服务 器 体系 结构 会 得 到 以 下 一 些 好 处 

(Atre, 1995 ): 

* 功能 可 以 分 阶段 交付 给 最 终 用 户 。 因 此 ， 在 项 目的 第 一 阶段 布 署 完 毕 后 就 可 以 利用 相应 
的 那 部 分 功能 。 

“客户 /服务 器 环境 中 常见 的 图 形 用户 界 面 可 以 使 用 户 利 用 应 用 程序 的 功能 。 

"客户 /服务 器 解决 方案 的 灵活 性 和 可 伸缩 性 能 促进 业务 处 理 的 再 工程 。 

"更 多 的 处 理 可 以 在 接近 数据 源 的 地 方 执行 ， 因 而 提高 了 响应 时 间 并 减少 了 网 络 流量 。 

* 客户 /服务 器 结构 开发 启用 Web 的 应 用 程序 ， 便 于 组 织 内 部 进行 有 效 沟通 并 提高 了 在 因 特 
网 上 执行 外 部 业务 的 能 力 。 


9.11 客户 端 应 用 程序 的 数据 库存 取 


在 本 章 前 面 ， 图 9-1 找 述 了 必须 在 两 层 或 二 层 客户 /服务 器 应 用 环境 中 分 布 的 程序 逻辑 组 件 。 
分 割 环境 以 创建 一 个 两 层 、 三 层 或 是 n 层 体系 结构 意味 着 必须 作出 如 何 分 布 处 理 逻 辑 的 决定 。 
在 每 一 种 情况 下 ， 存 储 逻 辑 (数据 库 引 擎 ) 由 服务 器 处 理 ， 而 表示 逻辑 则 由 客户 机 处 理 。 

图 9-8a 描 述 了 可 能 使 用 的 两 层 系统 ， 把 处 理 逻辑 放 在 客户 端 (创建 一 个 胖 客 户 机 )， 或 者 
放 在 服务 器 〈 创建 一 个 瘦 客 户 机 ) ， 或 是 在 服务 器 和 客户 端 之 间 进 行 分 割 (一 个 分 布 式 环境 )。 
在 三 种 情况 中 所 要 强调 的 就 是 处 理 逻辑 的 放置 。 在 胖 客 户 机 情况 下 ， 应 用 处 理 完全 在 客户 端 发 
生 ; 而 在 瘦 客 户 机 情况 下 ， 这 种 处 理发 生 在 服务 器 一 端 。 在 分 布 式 环境 的 例子 中 ， 应 用 处 理 是 
在 客户 机 和 服务 器 之 间 进 行 分 割 的 。 

图 9-8b 显 示 了 一 种 典型 的 三 层 体系 结构 和 n 层 体系 结构 。 如 果 需 要 的 话 ， 某 些 处 理 逻 辑 被 
放置 在 客户 端 。 但 是 ， 启 用 Web 的 客户 /服务 器 环境 中 的 客户 机 是 一 种 瘦 客 户 机 ， 它 使 用 浏览 器 
来 处 理 表示 有 逻辑 。 中 间 层 一 般 是 用 可 移植 的 语言 (如 C 或 Java) 来 编码 的 。n 层 结构 方法 的 灵活 
性 和 易 管 理性 是 它 得 以 迅速 流行 的 主要 原因 ， 虽 然 管理 各 层 之 间 的 通信 增加 了 其 复杂 性 ， 但 环 
不 掩 瑜 。 因 特 网 和 电子 商务 项 目的 快速 响应 、 分 布 式 和 异 构 的 环境 也 导致 了 许多 n 层 体系 结构 
的 开发 。 

客户 端 负 责 表示 逻辑 。 用 户 通过 他 们 的 浏览 器 、 一 个 应 用 程序 或 者 是 一 个 编程 界面 与 系统 
的 其 他 部 分 进行 交互 。 这 些 界面 已 经 完全 由 图 形 用 户 界面 (GUI) 所 主宰 。 存 取 数 据 库 的 界面 
也 同样 利用 图 形 用 户 界面 。 虽 然 SQL 语法 仍然 用 来 直接 与 数据 库 进行 通信 ， 但 针对 查询 数据 库 
的 按 例 查询 (QBE) 方法 也 已 经 证 明 是 一 种 流行 的 界面 。 使 用 的 便利 以 及 能 够 在 诸如 微软 的 
Access 这 样 的 桌面 数据 库 产品 中 进行 编程 的 能 力 使 许多 组 织 使 用 这 类 软件 包 ， 作 为 附属 于 一 个 
功能 强大 的 后 端 数据 库 (如 Oracle 或 Informix) 的 前 端 。 例 如 ， 通 过 使 用 传递 查询 ( 它 存 
Access 中 编制 但 却 基于 后 端的 Oracle 数 据 库 运行 )， 许 多 组 织 大 大 缩短 了 开发 时 间 ， 但 又 利用 了 
更 强壮 和 功能 更 强大 的 关系 型 数据 库 管理 系统 完成 他 们 那些 关键 任务 的 应 用 。 
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瘦 客 户 
a) 两 层 客户 /服务 器 环境 


| 
服 | 器 在 储 逻 辑 
Oracle 
| ea | 储 逻 辑 Solaris 
| ff SQL*Net 
TCP/IP 
Top 
| 程序 App/Server 
处 理 芝 辑 TCPHP 
服务 器 -二 服务 名 Solaris 
App. Services 


SQL*Net HTTP 
Tuxedo . CGI; TCPHP 
TCPNP Web 服 务 器 处 理 遥 加 Windows 2000 
Solaris App/Server API 
Internet Explorer 
上 HTTP 
Windows 98 


b) n 层 客户 /服务 器 环境 (会 存在 许多 种 可 能 性 ， 这 些 只 是 一 些 例子 ) 
图 9-8 常见 逻辑 分 布 





9.12 使 用 按 例 查询 


按 例 查询 (Query-by-Example，QBE) 是 使 用 最 广泛 的 直接 操纵 数据 库 查 询 语言 。 虽 然 
QBE 不 像 SQL 那 样 是 一 种 国际 标准 ， 但 它 已 经 广泛 应 用 了 许多 年 ， 尤 其 是 在 PC 关系 型 数据 库 
管理 系统 市 场 应 用 了 许多 年 。 作 为 一 种 直接 操纵 的 查询 语言 ， 想 要 对 某 个 数据 库 进行 查询 的 所 
有 人 员 都 能 够 轻松 地 学 会 它 。 同样， 它 的 简单 性 使 它 成 为 开发 原型 的 一 种 流行 语言 。 由 于 有 些 
数据 库 系 统 (比如 微软 的 Access) 能 把 QBE 查 询 翻译 成 SQL， 所 以 QBE 至 少 可 以 用 作 在 创建 
SQL 代码 时 的 第 一 遍 扫描 。 产 生 SQL 代 码 的 基于 QBE 的 系统 随后 可 以 用 来 构建 访问 服务 器 数据 
库 的 表示 层 或 客户 端 层 的 模块 。 在 本 节 ， 你 将 了 解 QBE 的 历史 以 及 这 种 重要 的 数据 库 操纵 语言 
的 许多 查询 功能 。 

9.12.1 QBE 的 历史 和 重要 性 
尽管 QBE ( 同 SQL 一 样 ) 最 初 是 用 于 大 型 主机 的 数据 库 处 理 的 ， 但 它 也 在 客户 /服务 器 和 
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个 人 计算 机 数据 库 系统 中 非常 流行 。QBE 最 初 是 由 Zloof (1977) 开发 ， 并 在 IBM 大 型 主机 的 
SQL/DS 和 DB2 数 据 库 系 统 中 首次 使 用 。 第 一 个 个 人 计算 机 上 的 关系 型 数据 库 管 理 系统 (PC- 
RDMBS ) Paradox 是 完全 基于 QBE 的 , 它 的 成 功 促 使 其 他 产品 采用 QBE 界 面 作为 一 种 可 选 方案 。 
大 多 数 当 前 的 系统 都 包括 一 个 QBE 的 变化 版 本 。 

了 解 QBE 对 于 理解 现代 数据 库 系 统 是 极 有 必要 的 。 这 是 因为 QBE 是 一 种 生产率 极 高 的 编程 
语言 。 可 视 化 的 编程 语言 ， 比 如 Visual Basic、Visual C 或 者 Visual Java 已 经 改变 了 编写 程序 的 
方法 。 有 关 研 究 (例如 ，Greenblatt and Waxman,1978; Thomas and Gould,1975) 已 经 表明 ， 
即使 只 有 很 少 的 培训 ， 学 生 们 发 现 QBE 使 用 起 来 要 比 SQL 或 是 某 种 关系 代数 语言 容易 得 多 。 虽 
然 这 些 研究 已 经 有 20 多 年 历史 ， 但 还 没有 新 的 数据 库 查询 语言 比 QBE 更 加 易 用 。 

QBE 对 于 基 终 用 户 的 数据 库 编 程 最 为 有 用 。 不 答 执 行 什么 样 的 数据 库 任 务 ， 这 个 可 视 化 编 
程 环境 让 不 会 编程 的 用 户 可 以 从 某 种 角度 看 到 数据 。 正 如 你 将 会 看 到 的 (以 及 第 2 章 已 经 表明 
的 ) 那样 ， 查 询 是 在 一 个 监视 器 屏幕 上 以 一 种 类 似 期 望 输出 的 格式 完全 交互 地 进行 开发 的 。 在 
大 多 数 程序 里 ， 查 询 和 结果 是 以 相同 的 格式 显示 的 ， 通 常 是 以 一 种 电子 表格 的 格式 显示 的 。 

完整 的 数据 库 应 用 程序 可 以 用 QBE 来 编写 ， 但 更 常见 的 是 使 用 QBE 进 行 交 互 查询 或 对 一 个 
数据 库 进 行 更 新 。 也 就 是 阅 ，QBE 对 于 特殊 数据 库 处 理 特 别 有 用 。 较 之 在 QBE 中 开发 一 个 完整 
的 应 用 程序 ， 更 常见 的 是 使 用 QBE 来 构建 一 个 应 用 程序 的 原型 ， 从 而 省 掉 了 需要 开发 的 查询 。 
这 些 省 掉 的 查询 随后 可 以 使 用 应 用 程序 生成 器 工具 ， 比 如 屏幕 、 表 单 和 报表 生成 器 以 及 通过 增 
加 使 用 与 PC-RDBMS 有 关 的 数据 库 语 言 开发 的 代码 模块 来 提供 定制 行为 来 增强 这 些 查 询 。 
9.12.2 QBE: 基本 知识 

QBE 并 没有 像 SQL 那 样 的 官方 标准 (参见 第 8 章 关 于 SQL 标 准 化 的 讨论 )。 因 此 ，QBE 不 存 
在 一 个 最 小 的 功能 集合 ， 查 询 界面 必须 满足 这 个 集合 才能 被 当 作 某 种 QBE 实 现 。 但 是 ， 由 于 
QBE 是 从 对 数据 库 查 询 语言 的 研究 中 进化 而 来 的 ， 而 且 Windows 的 可 视 化 界面 已 经 标准 化 了 ， 
并 且 它 是 一 种 可 视 化 语言 ， 所 以 所 有 的 供应 商都 采用 相似 方法 来 实现 QBE。 

数据 检索 和 数据 修改 可 以 通过 在 一 个 表格 布局 的 单元 内 输入 关键 词 、 常 量 和 范例 数据 来 完 
成 。 由 于 数据 定义 存储 在 内 部 表 中 ， 所 以 即使 是 数据 定义 也 可 通过 一 个 相似 的 表格 布局 界面 来 
完成 。 在 微软 的 Access 2000 (在 本 章 中 与 Oracle 8 一同 作为 例子 ) 中 ， 点 击 某 个 SQL 按钮 将 会 
显示 在 构建 基于 QBE 的 查询 时 产生 的 Access SQL 代码 。 

图 9-9 描 述 了 最 初 的 微软 Access 可 用 性 层次 结构 。 金 字 塔 说 明了 Access 可 以 用 于 编程 能 力 和 
复杂 性 不 同 的 程序 。 在 金字 塔 的 最 底层 是 对 象 ， 
它 允 许 创 建 各 种 表格 、 查 询 、 表 单 和 报表 而 不 
需要 具备 专门 的 编程 知识 。 在 金字 塔 的 上 一 层 
能 够 使 用 表达 式 或 函数 以 执行 诸如 字段 的 相 乘 、 
数据 的 确认 或 者 实施 某 种 业务 规则 这 样 的 简单 
进程 。 在 第 三 层 一 一 安 中 ， 用 户 可 以 利用 预存 
储 的 Visual Basic 应 用 程序 (VBA) 代码 模块 来 
自动 操作 他 们 的 应 用 程序 ， 而 且 不 需要 详细 了 
解 VBA。 在 第 四 层 ， 用 户 可 以 编写 他 们 自己 的 
VBA 代 码 以 定制 他 们 自己 的 应 用 程序 。 在 最 顶 
层 ，Windows API 调 用 以 诸如 C、Java 或 visual 
Basic 这 些 语言 编写 的 函数 或 动态 链接 库 ， 它 们 








对 象 一 一 表 、 查 询 、 表 单 和 报表 





B i ; 图 9-9 ”Access 可 用 性 层次 结构 
可 用 来 编写 和 其 他 程序 和 数据 源 交 互 的 接口 。 (改编 自 Prague & Irwin，1997) 
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QBE 提 供 了 一 种 简单 、 可 视 化 的 方法 来 确定 合格 的 查询 。 显 示 的 数据 也 许 仅 限 于 具有 期 望 
值 的 某 些 列 和 记录 ， 就 像 第 8 章 使 用 SQL 时 所 显示 的 那样 。 事 实 上 ， 传 达 一 个 在 QBE 面 板 中 所 
构建 查询 的 Access SQL 总 是 能 通过 点 击 那个 SQL 图 标 来 查看 。 

在 Access 2000 中 ，QBE 面 板 (参见 图 9-10) 的 上 部 有 一 部 分 工作 空间 ， 在 工作 空间 中 可 以 
放置 一 次 查询 中 所 涉及 的 表 或 查询 的 数据 模型 表示 。 以 前 建立 的 联系 也 会 自动 显示 出 来 。 有 时 ， 
某 个 查询 中 还 需要 其 他 的 联系 ， 而 该 联系 也 能 在 QBE 面 板 中 建立 。QBE 面 板 的 下 部 称 为 查询 设 
计 面 板 或 QBE 网 格 ， 该 部 分 显示 一 个 电子 表格 形式 的 表 ， 在 那里 放置 了 查询 所 需 的 字段 以 及 查 
询 所 需 的 任何 排序 和 限制 标准 。 每 个 QBE 网 格 中 的 列 包含 来 自 工 作 空 间 的 一 个 表 或 查询 的 某 个 
字段 的 有 关 信 息 。 图 9-10 显 示 了 一 个 选择 查询 的 QBE 面 板 ， 包 括 要 求 得 出 对 每 个 产品 在 哪 次 订 
购 完成 的 有 关 信 息 的 产品 和 订购 项 表格 。 注意 , 图 9-11 所 显示 的 结果 被 称 为 动态 集合 (dynaset)。 
虽然 这 个 结果 看 上 去 像 一 个 表 ， 但 它 并 不 像 它 所 基于 的 那个 原始 表 那 样 是 一 个 基 表 。 相 反 ， 它 
古 一 个 动态 或 虚拟 的 记录 集合 ， 而 且 并 不 保存 在 数据 库 内 。 图 9-12 显 示 了 这 个 查询 的 Access 
SQL 视 图 。 





图 9-10 设计 模式 下 的 MS Access 2000 多 表 查 询 ( 松 谷 家 具 公 司 ) 


动态 集合 的 好 处 在 于 ， 所 使 用 的 存储 设备 只 要 求 较 少 的 存储 空间 ， 而 且 当 查询 运行 时 ， 它 
会 使 用 数据 库 的 当前 版 本 ， 即 数据 库 会 包括 自 上 次 查询 以 来 增加 或 更 新 的 任何 记录 。 因 此 ， 查 
询 看 起 来 就 像 第 8 章 所 讨论 的 关系 视图 。 如 果 你 需要 把 查询 结果 存储 进 一 个 新 的 表 ， 可 以 使 用 
构造 表 查 询 。 

迅速 回顾 一 下 SQL 中 ( 见 第 8 章 ) 的 多 表 查 询 将 会 提醒 你 有 必要 确定 哪些 表 是 在 查询 中 需 
要 的 〈 在 FROM 语句 )， 并 设 定 在 查询 中 所 需 的 每 个 表 之 间 的 等 同性 〈( 在 WHERE 语句 )。 如 果 
某 人 打字 的 速度 不 快 ， 那 么 将 这 些 链接 在 SQL 中 进行 编码 就 是 非常 耗 时 的 。 而 在 MS Access 
2000 QBE 中 ， 当 这 些 联 系 在 Relationship 屏 幕 上 明确 地 显示 出 来 时 ， 这 些 链接 就 已 经 建立 ， 将 
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所 需 的 表 放 在 QBE 面 板 中 时 就 自动 加 入 了 这 些 链 接 ， 因 而 不 必 键 入 每 个 链接 。 这 在 开发 查询 时 
能 够 非常 节省 时 间 并 能 保证 准确 性 。 如 图 9-10 所 示 ， 查 询 中 所 用 的 两 个 表 已 经 被 添加 进 QBE 面 
板 ， 而 查询 结果 所 需要 的 字段 已 经 被 选取 并 拖 进 QBE 网 格 中 。 图 9-12 显 示 了 通过 点 击 和 拖 电 已 
经 建立 了 多 少 SQL。 注 意 ， 即 便 QBE 网 格 并 未 包括 用 来 建立 两 个 表 之 间 链 接 的 PRODUCT_t 表 
所 含 的 主键 列 (Product_ID )，SQL 中 ee J 含 了 正确 的 链接 。 还 要 注意 ，Access SQL 与 第 8 
章 所 使 用 的 Oracle SQL*Plus 有 所 不 同 ( 尔 也 许 起 想 写 出 与 图 9-12 中 的 代码 等 价 的 Oracle SQL 代 
码 )。 这 些 差别 说 明 每 个 供应 商都 有 自己 的 SQL.。 


和 500 

13 太 3h $20° 00 

Nat 人 $207 0 

$5 Comp Aer esk atura st $375 00 
3 CompAer -635k Natura’ ASh $375 00 
3 Comp ter Desk Nataral A $375 的 
1 Entertsinrent Cemer Natura Msp 6 $55 00 
4 Enterainrent Cemer Nature Mapie $68 00 
1 Enterarrm ent Cen:e: Natofa Maple Eo 
2 Entertsinment Cerer Natyra Msp's 5c OO 


2 Wrter's Desx Cherry $325 00 
2 -Drawer Dresser Hae Asn P00 
3 Dinng Table Neatuta 和 3 $605 00 
2 Computer Desk Yainul $2 00 
3 Compter Sesk Ysinut $255 60 
0 Computer -8zk Wainit $250 00 





图 9-11 MS Access 2000 动 态 集合 (从 图 9-10 得 出 的 查询 结果 ) ( 松 谷 家 具 公 司 ) 








ret Ordered OO PRODUCT + Product_ Descripton, PROOUCT K.Product_Finish, 
bed A Standard_ Price) AS Se Prre] 


R ne > 
由 POOUCY YProdet = yr a 


i DER pe 3 Sa pe zwr ~ a pe ee rr 


图 9-12 MS Access 2000 在 SQL 视 图 下 的 多 表 查 询 ( 松 谷 家 具 公 司 ) 


9.12.3 选择 合格 的 记录 

如 果 你 只 是 对 某 些 记录 感 兴趣 那 该 如 何 呢 ? 图 9-13 显 示 了 输入 限定 条 件 显 示 所 需 记 录 的 基 
本 方法 。 在 相关 联 的 列 下 面 放置 条 件 能 够 完成 这 一 任务 。 所 返回 的 动态 集合 如 图 9-14 所 示 。 和 条 
件 可 以 是 一 个 不 等 式 ， 如 图 9-13 中 所 示 的 那样 ， 它 也 可 以 包含 一 个 范围 或 等 式 。 a 本 
在 图 9-13 中 的 Standard_Price 列 下 面 输入 “Between 350 and 7002 ， 以 了 解 哪 些 产品 处 于 这 个 价 
格 范 围 中 。 

运算 符 、 函 数 以 及 表达 式 也 可 在 构 寻 查询 的 标准 时 使 用 。 数 学 运算 符 (比如 乘法 和 除法 ) 


可 以 在 数字 字段 上 使 用 。 关 系 运 算 符 ， 比 如 相等 、 不 等 、 
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小 于 能 用 于 数字 字段 、 日 期 字段 和 文 


本 字段 。 布 尔 或 逻辑 运算 符 则 可 用 于 在 表达 式 中 设 定 条 件 。 


or ne t lOrder.b 
pcere | 


ed RY 


eT 
ed 


CT lpn 
i 
一 一 


ND 





Natural Ash 
Natural ASHh 


5 Computer Desk 

3 Compitet Oesk 

§ Erastamme Conte: Natural Mapie 

3 End Tabie Chery 

3 Romputat Desk Wainut 

3 Computer Desk Natuti Ash 

3 Dining Table Natural Ash 
10 Compulet Desk Walnut 


图 9-14 图 9-13 的 查询 中 得 出 的 动态 集合 ( 松 谷 家 具 公 司 ) 


函数 是 基于 函数 执行 的 某 个 计算 或 比较 而 返回 某 个 数值 的 代码 模块 。 函数 可 以 返回 字符 串 、 
逻辑 或 数字 值 ， 这 取决 于 该 函数 的 性 质 。 微 软 公司 的 Access 拥 有 许多 已 经 存储 的 常用 函数 可 供 
使 用 ， 比 如 sum 或 average， 或 者 用 VBA 编 写 一 些 专 门 的 函数 。 表 达 式 是 由 运算 符 控制 的 一 个 条 
件 或 一 系列 条 件 。 通 过 插入 所 需 的 字符 (比如 引号 ， 如 果 它 们 不 再 使 用 的 话 )，Access 将 试图 


用 表达 式 语 法 提供 帮助 。 


9.12.4 自 联结 


有 些 查询 用 QBE 界 面 来 构建 要 容易 得 多 ， 因 为 它 的 可 视 化 表示 比 输入 一 个 复杂 的 语句 要 清楚 
得 多 。 例 如 ， 当 查询 要 求 一 个 表 和 它 自 身 联结 时 用 QBE 界 面 就 很 方便 。 这 种 类 型 的 查询 称 为 自 联 
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结 (self-join) 或 者 递归 联结 (recursive join)。 例 如 ,假定 你 想 要 知道 哪些 订单 会 包括 与 1004 号 订 
单 相同 的 产品 。 进 行 这 样 的 查询 可 能 是 因为 该 订单 的 某 个 包装 出 了 问题 ， 而 你 需要 找 出 是 否 其 他 
订单 也 有 相同 的 问题 。 图 9-15a 所 示 的 是 回答 这 个 问题 的 Access 2000 的 QBE 查 询 。 一 个 自 联 结 可 
以 用 以 下 方法 实现 ， et Line _t 表 的 拷贝 ， 设 定 两 个 产品 ID 之 间 的 某 
种 联系 (参见 连接 两 个 表 中 的 Product_ ID 字段 之 间 的 联系 线 )， 并 在 一 个 表 中 确定 1004 的 标准 而 在 
男 一 个 表 中 确定 NOT 1004 的 标准 ， 它 们 会 返回 产品 ID 和 数量 值 。 我 们 可 以 在 图 9-1Sb 中 看 到 ， 仅 
有 8 号 产品 在 其 他 订单 中 被 订购 。 有 三 个 8 号 产品 在 1008 号 订单 中 订购 ， 有 十 个 8 号 产品 在 1010 号 
订单 中 订购 。 图 9-15c 显 示 的 是 SQL ( 它 能 在 一 个 本 地 数据 库 或 服务 器 数据 库 上 运行 )。 


a) MS Access 2000 来 自 松 谷 家 具 公 司 的 递归 联结 








6) MS Access 2000 在 SQL 视图 下 的 递归 联结 查询 ( 松 谷 家 具 公 司 ) 
图 9-15 递归 联结 的 例子 : 哪些 订单 拥有 与 1004 号 号 订单 相同 的 产品 
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9.12.5 让 一 个 查询 基于 另 一 个 查询 

有 时 ， 即 使 使 用 QBE 也 很 难 在 一 次 查询 中 回答 某 个 问题 。 解 决 这 种 难度 较 大 的 查询 的 一 种 
方法 是 把 一 个 查询 分 解 为 几 个 步骤 ， 保 存 回答 某 个 特定 步骤 所 产生 的 查询 结果 ， 然 后 下 一 步 的 
查询 是 基于 所 保存 的 查询 结果 而 不 是 基 表 。 这 种 方法 有 时 与 使 用 SQL 中 的 子 查询 相似 。 因 此 ， 
让 一 个 查询 基于 另 一 个 查询 使 你 可 以 利用 保存 的 查询 所 产生 的 动态 集合 来 计算 SUM、COUNT 
等 的 值 ， 因 而 可 以 解决 使 用 第 8 章 所 讨论 的 记录 组 的 函数 所 固有 的 一 些 困难 。 

假定 你 想 要 找 出 哪些 顾客 在 2000 年 10 月 期 间 没 有 从 松 谷 家 具 公 司 购 买 产品 。 也 就 是 说 ， 你 
想 要 知道 Custom_t 表 中 的 哪些 顾客 号 没有 列 在 2000 年 10 月 Order_t 表 中 的 记录 中 。 图 9-16a~ 图 
9-16d 说 明了 如 何 通 过 建立 一 个 查询 然后 再 用 第 一 次 查询 的 结果 构建 第 二 个 查询 来 回答 这 个 问 
题 。 第 一 次 查询 (图 9-16a 中 的 QBE 和 图 9-16b 中 的 动态 集合 结果 ) 返回 的 是 在 10 月 份 下 订单 的 
顾客 。 这 次 查询 的 QBE 被 保存 在 一 个 称 为 “First Query” 的 查询 中 。 第 二 次 查询 (图 9-16c 中 的 
QBE 和 图 9-16d 中 的 动态 集合 结果 ) 随后 使 用 一 个 外 联结 来 比较 所 有 顾客 的 列表 ( 表 Custom_t) 
和 那些 下 订单 的 顾客 (由 “First Query” 所 定义 的 虚拟 表 )， 并 返回 那些 未 能 在 第 一 次 查询 的 
动态 集合 中 找到 的 顾客 的 动态 集合 (参见 图 9-16c 中 的 “Is Null” 限 定 条 件 )。 
9.12.6 使 用 SQL 传递 查询 

MS Access 之 所 以 成 为 最 常用 的 客户 /服务 器 应 用 程序 中 的 客户 端 界面 的 原因 之 一 是 ， 人 们 
可 以 轻松 地 直接 传送 命令 给 任何 ODBC (开放 数据 库 互 连 ) 数据 库 服务 器 。 使 用 一 个 传递 查询 
( 它 可 以 用 ODBC 数 据 库 服务 器 的 SQL 方言 而 不 是 MS Access SQL 来 编写 ) ， 你 就 能 直接 利用 服 
务 器 的 表 而 不 用 再 链接 到 它们 。 这 就 绕 过 了 微软 的 Access Jet 数 据 库 引擎 ， 从 而 使 性 能 更 好 。 
所 有 SQL 查询 的 语法 检查 、 解 释 和 翻译 都 将 在 服务 器 的 数据 库 上 进行 。 网 络 流量 将 会 减少 ， 因 
为 必须 在 服务 器 和 客户 端 之 间 传 送 的 只 有 最 初 的 SQL 查询 和 所 要 返回 的 记录 。 








和 Se 3 





a) MS Access 2000 中 用 于 图 9-16c 的 下 一 次 查询 的 基 查 询 
图 9-16 根据 另 一 个 查询 而 进行 的 查询 
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d) 由 图 9-16c 的 查询 所 返回 的 MS Access 2000 动 态 集合 
图 9-16 ( 续 ) 
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MS Access 传 递 查询 可 以 用 来 检索 记录 、 改 变数 据 或 者 执行 位 于 数据 库 服 务 器 上 的 存储 过 
程 或 触发 器 。 人 们 甚至 能 在 服务 器 数据 库 上 创建 新 表 。 但 要 小 心 ， 不 要 执行 会 影响 连接 状态 的 
操作 ， 因 为 这 样 会 造成 不 可 预测 的 结果 。 

这 种 方法 并 不 能 让 你 把 ODBC 数 据 库 的 表 链 接 到 MS Access (链接 表 将 在 本 章 稍 后 部 分 讨 
论 )。 这 意味 着 你 不 能 创建 一 个 基于 这 些 表 的 可 更 新 记录 集合 。 用 户 必 须 熟 悉 ODBC 数 据 库 所 
使 用 的 SQL 方言 。 因 此 ， 尽 管 能 获得 较 高 的 性 能 收益 ， 并 且 有 可 能 利用 大 型 数据 库 服 务 器 的 强 
大 功能 ， 但 用 户 必 须 了 解 所 使 用 的 SQL 方言 ， 而 且 必 须 准 备 进 行 更 多 的 人 工 操作 来 实现 完整 的 
功能 。 

创建 一 个 MS Access 传 递 查 询 要 求 指定 一 个 连接 字符 串 ， 无 论 是 作为 传递 查询 的 一 个 性 质 
还 是 在 运行 查询 时 都 是 如 此 。 图 9-17 显 示 了 Oracle 的 SQL 语法 以 及 包含 某 条 Oracle 的 SQL 语句 的 
一 个 MS Access 2000 传 递 查 询 的 性 质 窗口 。 





图 9-17 带 有 查询 性 质 窗口 的 MS Access 2000 SQL 传递 查询 


重要 的 是 ， 要 注意 每 个 关系 数据 库 管 理 系统 (比如 Oracle、Informix 或 者 SQL 服务 器 ) 都 
会 拥有 自己 关于 ODBC 连 接 字 符 串 的 语法 ， 这 个 字符 串 必须 插入 性 质 窗口 或 者 在 查询 运行 时 输 
入 。 例 如 ， 这 里 使 用 的 Oracle 连 接 字 符 串 的 语法 是 : 

ODBC:DSN=ODBC Connection Name; UID =User; PWD=Password; SERVER=Connection 


Alias from TnSNames.ora; 


9.13 使 用 ODBC 来 链接 存储 在 数据 库 服 务 器 上 的 外 部 表 


开放 数据 库 互 连 标准 (open database connectivity standard ) 是 在 20 世 纪 90 年 代 初期 由 
X/Open 和 SQL Access Group 委 员 会 开发 出 来 的 。 它 提出 了 关系 数据 库 管 理 系 统 能 够 实现 的 若干 
层 标准 ， 因 此 能 使 任何 应 用 程序 使 用 一 个 公用 的 存 取 和 处 理应 用 编程 接口 (API) 来 对 它们 进 
行 访 问 。 这 样 的 RDBMS 是 与 ODBC 兼 容 的 。 这 个 标准 已 经 得 到 了 广泛 的 认可 ， 而 最 早 是 由 微 
软 公 司 在 他 们 的 产品 中 实现 了 ODBC 这 个 标准 。ODBC 对 于 因特网 应 用 来 说 也 是 非常 重要 的 ， 
因为 它 能 允许 开发 出 访问 不 同 数据 库 产 品 的 应 用 程序 。 为 了 实现 这 种 功能 ，ODBC 使 用 了 第 8 
章 所 介绍 的 ANSI 标 准 类 SQL 语句 ， 但 它 不 能 利用 每 个 供应 商 赋予 其 引擎 的 扩展 和 特殊 特性 。 
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ODBC 规 范 人 允许 驱动 程序 遵守 不 同 层 次 的 规范 ， 而 这 样 影响 了 该 驱动 程序 的 功能 层次 。 驱 
动 程序 本 身 在 编写 上 的 差别 可 能 会 影响 所 要 实现 的 性 能 。 每 个 想 要 拥有 一 个 兼容 ODBC 标 准 的 
数据 库 供 应 商都 提供 一 个 能 够 安装 在 Windows 机 器 中 的 ODBC 驱 动 程序 。 因 此 ， 每 个 windows 
应 用 程序 都 能 通过 恰当 的 驱动 程序 ， 与 数据 库 服 务 器 的 某 个 版 本 进行 通信 。 例 如 ， 一 个 MS 
Access 应 用 程序 可 以 与 一 个 Oracle 数 据 库 服务 器 进行 连接 以 执行 操作 。 数 据 库 的 表 通 过 ODBC 
链接 被 链接 到 MS Access 的 应 用 程序 ， 并 且 仍 然 保 存在 Oracle 数 据 库 内 。 它 们 并 没有 存储 到 MS 
Access 的 数据 库 中 。 

你 也 许 听 说 Oracle 的 数据 库 服 务 器 通常 就 称 为 数据 库 服 务 器 ， 但 它 也 可 以 称 为 远程 服务 器 、 
后 端 服务 器 或 者 SQL 服务 器 。 正 如 微软 公司 的 后 端 服务 器 被 称 为 SQL 服务 器 一 样 ， 提 及 SQL 服 
务 器 可 能 是 指 某 一 类 型 的 服务 器 或 是 某 个 特定 供应 商 生产 的 数据 库 服 务 器 。 这 会 让 人 觉得 混淆 
不 清 。 

必须 确定 5 个 参数 后 才能 建立 一 种 ODBC 连 接 : 

。 需 要 特定 的 ODBC 了 驱动 程序 。 

。 可 连接 的 后 端 服务 器 名 称 。 

。 可 连接 的 数据 库 名 称 。 

* 允许 访问 该 数据 库 的 用 户 ID。 

“用 户 ID 的 口令 。 

如 果 需 要 的 话 ， 还 可 能 要 提供 额外 的 信息 : 

。 数 据 源 的 名 称 (DSN )。 

。Windows 客 户 端 计算 机 名 称 。 

。 客 户 端 应 用 程序 的 可 执行 名 称 。 

这 些 参数 可 以 从 不 同 的 位 置 进行 确定 。 它 们 可 以 包括 在 程序 中 ， 或 者 通过 DSN 确 定 ， 或 者 
在 提示 时 由 用 户 提供 。 在 程序 中 包括 以 上 所 有 的 参数 使 得 程序 能 够 直接 与 数据 库 连 接 ， 而 不 用 
进一步 的 通信 。 当 然 ， 有 时 不 得 不 修改 程序 并 插入 新 的 参数 值 以 便 把 该 程序 移植 到 另 -个 服务 
器 或 者 关系 数据 库 管理 系统 。 在 程序 中 包括 DSN ( 它 包 含 了 某 些 参 数值 ) 能 够 使 本 地 管理 员 放 
置 煞 据 库 并 选择 某 个 关系 数据 库 管 理 系统 。 用 户 可 以 在 登录 时 提供 他 的 用 户 ID 和 口令 来 使 用 这 
个 应 用 程序 。 

图 9-18 是 一 个 典型 的 ODBC 体 系 结构 的 示意 图 。 客 户 机 应 用 程序 请 求 与 某 个 数据 源 建 立 一 
种 连接 。 这 个 请 求 由 微软 的 驱动 程序 管理 器 处 理 ， 它 能 确定 恰当 的 ODBC 驱 动 程序 以 供 使 用 。 
记 住 ， 这 些 驱 动 程序 是 由 供应 商 提 供 的 ， 因 此 可 能 会 有 SQL 服务 器 驱动 程序 、Oracle 驱 动 程序 
或 者 是 Informix 驱 动 程序 等 等 。 初 始 化 请 求 、 格 式 确认 以 及 ODBC 请 求 管理 也 都 由 驱动 管理 器 
来 处 理 。 所 选择 的 驱动 程序 将 会 处 理 从 客户 端 收 到 的 请 求 ， 并 向 所 选择 的 关系 数据 库 管理 系统 
提交 用 这 种 特定 RDBMS 的 SQL 语 法 所 编写 的 查询 。 创 建 该 查询 所 要 求 的 处 理 量 取决 于 关系 数 
据 库 管理 系统 被 访问 的 能 力 。 

间 样 ，ODBC 的 一 致 性 层次 将 由 供应 商 已 经 提供 的 驱动 程序 的 功能 来 确定 。 有 三 种 一 致 性 
层次 : 核心 API、 第 一 层 API 和 第 二 层 API。 这 些 层次 都 是 由 本 节 前 面 所 提 到 的 标准 委员 会 确定 
的 。 大 多 数 驱 动 程序 提供 核心 API 和 第 一 肢 API， 它 们 包括 以 下 功能 : 

。 用 驱动 程序 特有 的 信息 与 数据 源 建立 连接 的 能 力 。 

"准备 和 执行 SQL 语句 。 

“从 一 个 结果 集合 检索 数据 。 

* 提交 或 回 滚 事 务 。 
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。 检 索 错 误 和 目录 信息 。 

。 发 送 并 接收 部 分 结果 。 

。 检 索 有 关 驱 动 程序 的 信息 。 

第 二 层 API 在 功能 上 的 一 些 狼 有 特征 包括 : 

* 浏览 潜在 的 数据 源 和 连接 的 能 力 。 

* 取 回 本 地 的 〈 后 端 方言 版 本 ) SQL。 

。 调 用 某 个 事务 库 。 

* 处 理 和 显示 一 个 可 滚动 的 游标 。 

应 用 程序 在 调用 驱动 程序 时 确定 可 供 利 用 的 API 的 有 层次。 如 果 需 要 第 一 层 API， 而 应 用 程 
序 只 是 第 一 层 的 API， 然 后 执行 序列 就 能 以 一 种 可 控 的 方式 中 止 ， 这 样 就 不 会 发 生 数据 破坏 。 
有 些 应 用 程序 是 既 可 在 第 一 层 执行 也 可 在 第 二 层 执行 的 ， 这 取决 于 所 使 用 的 特定 关系 数据 库 管 
理 系统 驱动 程序 的 功能 。 


应 刑 程序 
Microsoft 
Driver Manager 
A 
特定 的 ODBC 
狗 动 程序 


图 9-18 开放 数据 库 互 连 (ODBC) 结构 


9.14 使 用 JDBC 来 链接 存储 在 数据 库 服务 器 上 的 外 部 表 


Java 数 据 库 互 连 (JDBC) API 使 得 Java 程 序 能 够 执行 SQL 语句 并 与 数据 库 服务 器 进行 连接 。 
JDBC 类 似 于 ODBC， 但 它 是 专门 为 Java 应 用 程序 设计 的 。ODBC 是 与 语言 无 关 的 。Java 是 一 种 
用 于 客户 /服务 器 计算 的 优秀 语言 ， 因 为 它 是 面向 网 络 的 、 安 全 性 很 强 并 且 可 移植 。Oracle 公 司 
已 经 采用 了 yava， 而 且 似 乎 Oracle 的 专用 语言 PL/SQL 将 会 被 Java 所 取代 ， 以 便 提供 所 需要 的 
SQL 所 不 具备 的 编程 功能 来 构建 数据 库 应 用 程序 。 

JDBC 标 准 在 概念 上 与 微软 公司 的 ODBC 相 似 。 基 于 X/Open 的 SQL 调用 层次 接口 ，JDBC 包 
含 两 个 主要 的 层 。 一 层 是 JDBC API， 它 支持 从 一 个 Java 应 用 程序 到 JDBC 驱 动 程序 管理 器 的 通 
信 。 另 一 层 是 JDBC 驱 动 程序 APTI， 它 支 持 从 JDBC 驱 动 程序 管理 器 直接 到 JDBC 驱 动 程序 ， 以 及 
到 网 络 驱 动 程 序 和 基于 ODBC 的 驱动 程序 的 通信 。 

图 9-19 包 含 了 一 个 使 用 JDBC 来 存 取 兼 容 JDBC 的 数据 库 所 必需 的 代码 的 简单 示例 。 注 意 ， 
这 些 代 码 用 四 个 方 框 标 出 ， 以 强调 所 执行 的 不 同 任务 。 

首先 ， 导 入 9 个 预定 义 的 Java 包 。 每 个 驱动 程序 为 虚拟 类 提供 了 类 实现 ， 比如 java.sql. 
Connection 、java.sql.Statement、 java.sql.PreparedStatement 以 及 java.sql.CallableStatement。 这 
些 虚 拟 类 描述 了 特定 于 每 个 所 连接 的 数据 库 产品 的 API。 

图 9-19 中 的 例子 是 与 一 个 Oracle 数 据 库 连 接 ， 因 此 下 一 个 代码 框 包括 用 于 该 例 的 表 的 非常 
简单 的 结构 信息 ， 以 及 可 以 用 来 插入 下 一 个 主键 值 的 主键 序列 和 触发 器 。 在 这 种 情况 下 你 并 不 
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需要 知道 触发 器 的 代码 ， 这 里 的 代码 只 供 那 些 感 兴 趣 的 人 阅读 。 


下 一 步 ， 初 始 化 动作 发 生 ， 并 且 诸 如 用 户 ID、11 邻 、 驱 动 程序 类 、 驱 动 类 型 、 数 据 库 连接 
字符 串 等 等 的 值 都 被 确定 。 最 大 的 代码 框 显 示 了 如 何 与 数据 库 建 立 连接 (使 用 


buildConnection0) ) ， 并 把 传递 值 插 入 temp_demo 表 。 





//package.com.iteamsolutions.eis.toots.sqi.sample; ” 孔 定 义 的 Java 包 
importjava.sql.CallableStatement; 
importjava.sql.Connection; 
importjava.sql.Driver; 
importjava.sql.DriverManager; 
importjava.sql.PreparedStatement; 
importjava.sql.ResultSet; 
importjava.sql.Statement; 
importjava.sql.SQLException; 
importjava.sql. Types; 











f/f** 
* 这 个 类 用 证 简单 说 明 如 何 遂 过 JDBC 来 存 到 兼容 IDBC 的 数据 库 





Oracle 中 的 表 结 构 、 主 键 序列 以 及 触发 器 


*The database structure Jisted below will be used for all examples: (br ) 
* (pre ) 


TABLE temp_demo 

“Name Null?.. Type... 

*ID NOT NULL NUMBER 
*NAME VARCHAR2(20) 


“Sequence used to populate the primary key 
“SEQUENCE temp_demo_seq 


*—Trigger used to populate the primary key 
“CREATE OR REPLACE TRIGGER temp_demo_trig 
*BEFORE INSERTON temp_demo 

“FOR EACH ROW 

*BEGIN 

“一 This will allow the key to be autopopulated 
“一 could be retrieved using the RETURNING 
* 一 clause of the INSERT statement 

“一 IF(CNEW.id IS NULL) 

“THEN 

* SELECT temp_demo_seq.nextval 

” INTO :NEW.id 

* FROM dual; 

*END IF; 


*END; 
* (/pre ) 
* 《br ) 








图 9-19 使 用 JDBC 来 访问 … 个 兼容 JDBC 的 数据 库 
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{ 





初始 化 


public class OracleSqlTest 
/常生 .用 于 检索 表 temp_demo 中 的 记 列 */ 
public static final String ID = “id”; 
/于 党 时 用 于 检索 表 temp_demo 中 的 name 列 */ 
pubilic static final String NAME = “name"; 
/ 玉 数 据 库 账户 的 名和:*/ 
private String NAME = “username", 
j 竺 用 户 上 令 Y 
Private String m_password = “userpassword"; 
A 用 于 连接 数据 库 的 Driver 类 */ 
private String m_driver = “oracle.jdbc .driver.OracleDriver”; 
/ 绊 使 用 的 驱动 程序 类 型 
private String m_drivertype = "jdbc:oracle:thin:@"; 
/ 科 昌 连接 的 数据 库 ” 
prvate String m_database = “servername:1521:databasename". 


/六 插入 :条 新 记录 到 表 temp_demo 中 纪 


private String m_insert = “INSERT INTO temp_demo (id, name) values (?,?)"; 


/** 插 入 一条 新 记 六 他 temp_demor*/ 
private String m _insertReturning = “BEGIN\n" + 


“INSERT INTO temp_demo (name) values (?)\n" + 





“RETURNING id INTO ?; \n" + 
“END:;"; 


/ 纪 该 炎 完 成 所 有 工作 所 要 使 用 的 连接 ” 
Private Connection m_conn = null; 


< 


默认 的 构造 器 





可 以 对 它 进行 修改 以 支持 上 而 提 到 的 那些 值 、 这 些 参数 


* 也 可 以 从 一 个 性 质 文件 中 提 坡 出 来 


二 


* @throws Exception - any failure is a terminal condition 


*/ 


pubiic OracleSqlTest() 


{ 
} 


throws Exception 


m_conn = buildConnection(); 


/< 


* 插入 被 传递 的 值 到 表 temp_demo 中 


* @param id - number to be used as the primary key in the record 
“@param name - Name to be stored in the name column 


*/ 


public void insert(int id, String name) 


{ 


|. 


throws SQLException 


PreparedStatement stmt = null, 


try 
{ 
1 vpreparedStatement, preparedStatement 允 许 将 


Wf 所 传递 的 String 中 的 值 用 “3?” 来 代 黎 


stmt =m_conn.prepareStatement(m_insent); | 


图 9-19 〈 续 ) 
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1/ 将 实际 的 值 与 参数 “?” 绑 定 ， 第 一 个 参数 “?” 对 应 第 一 
1/ 依 此 类 推 

stmt.setint(1, id); 

stmt.setString(2, name); 


//exec the statement 
stmt.execute1); 


} 
catch (SQLException e) 


{ 


throw e; 


} 
finally 


! 1/ 保 证 所 有 的 资源 被 释放 ， 骆 则 由 于 打开 大 多 的 游标 
/W 会 导 敏 数据 库 产 生 中 党 
if(stmt! = null) 
stmt,close(); 








为 访问 Oracle 数 据 库 建立 连接 对 象 
ini 


* 为 访问 Oracle 数 据 库 建立 连接 对 象 ; 

*/ 

private Connection buildConnection() 
throws SQLException 

{ 
WN/ 记 该 确保 与 数据 库 对 应 的 颈 动 程序 被 装载 .产生 的 任何 异常 将 被 捕 
// 多 半生 新 产 下 -个 SQLException 用 于 被 客户 端 捕获 


try 
{ 
DriverManager.registerDriver 
((Driver) Class.forName(m_driver).newlnstance()); 


} 
catch (InstantiationException e) 
{ 
throw new SQLException(*Unable to instantiate the Oracle Driver"); 
} 
catch (lilegalAccessException e) 
{ 


throw new SQLException (“lllegalAccessException thrown when attempting to 
load the Oracle Driver class"); 


} 
catch (ClassNotFoundException e) 
{ 
throw new SQLException(“Oracle Driver class not found"); 


} 


// 代码 执行 到 这 里 表示 又 动 程序 已 经 被 成 功 注 册 了 ， 现 在 可 以 返回 一 个 Connection 
return (DriverManagergetConnection (m_drivertype + m_database， 
m_username， 
m_password)); 





图 9-19 ( 续 ) 
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最 后 一 个 代码 框 包 括 了 建立 Connectiona 对 象 所 必需 的 代码 ， 以 便 访问 Oracle 数 据 库 ， 其 中 
包括 如 果 由 于 这 样 或 那样 的 原因 没有 建立 连接 时 会 显示 的 错误 消息 。 这 个 JDBC 例 子 的 一 个 更 
完整 的 版 本 可 人 在 本 书 的 Web 站 点 找到 。 它 包括 了 另 一 种 插入 主键 值 的 方法 ， 而 且 还 包括 了 创建 
一 个 新 的 记录 以 及 修改 、 更 新 或 删除 记录 的 代码 。 


9.15 在 客户 端 应 用 程序 中 使 用 VBA 


Access 2000 允 许 初学 的 用 户 创 建 一 个 应 用 程序 的 原型 ， 其 中 包括 数据 库 设计 、 菜 单 、 表 单 
和 报表 。 但 是 ， 使 用 Access 的 宏 所 能 实现 的 功能 有 局 限 性 ， 开 发 人 员 在 尝试 包含 所 有 期 望 的 功 
能 时 会 受到 阻碍 。 尽 管 有 些 功 能 要 求 使 用 宏 并 旦 不 能 通过 VBA 来 实现 ， 但 更 多 的 功能 可 以 通过 
使 用 与 Access 2000 相 配套 的 VBA 来 实现 或 增强 。 如 果 对 Access 2000 有 了 基本 的 了 解 ， 就 会 了 
解 Access 2000 用 户 为 什么 需要 学 习 VBA (Smith and Sussman ，1997 ): 

* 复 杂 的 功能 只 有 通过 使 用 VBA 才 能 实现 。 显 示 错 误 消 息 ， 把 不 应 该 点 击 的 按钮 变 灰 等 等 
都 要 求 利 用 VBA 编 码 。 

。 错误 处 理 只 能 通过 使 用 VBA 才 能 实现 。 在 -- 个 已 经 完成 的 应 用 程序 中 依赖 宏 是 很 危险 的 ， 

因为 如 果 一 个 宏 崩溃 的 话 ， 用 户 是 没有 办 法 进行 恢复 的 。 

“ 更 快速 的 执行 只 有 在 应 用 程序 使 用 VBA 模 块 而 不 是 宏 时 才能 实现 。 代 码 的 执行 速度 要 比 

宏 更 快 ;， 应 用 程序 越 是 复杂 ， 这 种 优势 就 会 越 明 显 。 

“维护 会 更 加 简便 ， 因 为 VBA 模 块 是 与 表单 和 报表 一 起 存储 的 。 宏 则 是 与 它们 相关 的 表单 和 
报表 分 开 存储 的 。 现 在 ， 把 应 用 程序 移植 到 另 一 个 数据 库 将 会 更 加 方便 ， 因 为 VBA 横 块 将 
与 它们 的 表单 和 报表 一 起 迁移 (前 面 说 过 ，VBA 模 块 是 与 表单 和 报表 存储 在 一 起 的 )。 

。OLE 自 动 化 可 以 更 加 完整 地 得 到 使 用 。 

。 更 多 的 程序 控制 可 以 通过 使 用 VBA 来 实现 。 宏 不 能 将 一 个 变量 作为 参数 传递 给 另 一 个 变 
量 ， 而 且 不 能 方便 地 控制 动作 序列 。 

* 阅读 VBA 代 码 要 比 读 宏 参数 容易 ， 因 为 你 能 在 Full Module View 中 看 到 完整 的 模块 ， 它 是 
用 颜色 编码 的 文本 。 

必须 创建 一 个 自动 执行 的 宏 来 打开 某 个 数据 库 ， 而 且 宏 还 必须 用 来 捕获 应 用 程序 中 的 某 些 
击 键 的 操作 。 除 此 之 外 ， 把 一 个 用 安 编 写 的 原型 转换 为 应 用 程序 实用 版 本 的 VBA 模 块 将 会 产生 
具有 更 多 功能 的 更 为 强壮 的 应 用 程序 。 

Windows 操 作 系 统 和 Windows 应 用 程序 都 是 事件 驱动 (event-driven) 的 。 在 Access 2000 应 
用 程序 中 发 生 的 所 有 操作 都 是 对 Access 2000 所 侦 测 到 的 某 个 事件 (比如 一 次 鼠标 点 击 ) 的 响 
应 。 一 个 事件 发 生 ， 它 被 侦 测 到 ， 然 后 就 产生 对 该 事件 的 响应 。 因 此 ，Access 2000 并 不 是 过 
程 化 的 ， 即 下 一 个 事件 可 以 来 自 界 面 屏幕 上 的 任何 地 方 ， 或 者 来 自任 何 击 键 操作 。 在 一 个 事件 
坚 动 环境 中 的 编程 包含 对 象 的 创建 和 对 其 属性 的 修改 ， 这 样 它们 就 会 对 每 个 影响 该 对 象 的 事件 
作出 符合 程序 员 愿 望 的 响应 。 

图 9-20 显 示 了 当 显示 一 条 新 记录 时 让 Product Entry Form 的 NEXT 按 钮 不 可 用 ( 变 灰 ) 的 
VBA 代 码 。 表 单 的 记录 来 自 Product_t 表 ， 而 Product_ID 则 是 该 表 的 主键 。 当 前 记录 的 
Product_ID 值 是 用 Me.Product_ID 来 确定 的 。 如 果 当 前 记录 没有 主键 值 , 它 必定 是 一 个 新 的 记录 ， 
而 NEXT 按 钮 应 当 禁 用 。 由 于 禁用 具有 焦点 的 按钮 会 导致 一 个 运行 时 错误 ， 因 此 必须 先 将 焦点 
转移 到 其 他 地 方 。 焦 点 可 以 转移 到 PREVIOUS 按 钮 ， 然后 禁用 NEXT 按 钮 。 如 果 当 前 记录 并 不 
是 新 记录 ， 那 么 NEXT 按 钮 仍然 是 有 效 的 。 
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图 9-20 VBA 模 块 样本 


客户 /服务 器 体系 结构 已 经 为 企业 提供 了 许多 机 会 ， 以 便 让 他 们 的 计算 机 系统 更 好 地 满足 
他 们 的 业务 需求 。 在 客户 /服务 器 和 大 型 主机 数据 库 管理 系统 之 间 建 立 适 当 的 平衡 是 当前 讨论 
Dt enn eta Wee esetk ede 
位 。 本 章 讨论 了 几 种 客户 /服务 器 体系 结构 ， 其 中 包括 由 文件 服务 器 管理 文件 操作 并 由 附属 于 
局 域 网 上 的 每 个 客户 端 ea 构 。 文 件 服务 器 产生 了 极 大 的 网 络 负载 ， 因 为 
在 每 个 客户 机 上 都 要 有 一 个 完整 版 本 的 数据 库 管理 系统 ， 并 且 要 求 进行 复杂 的 编程 才能 管理 共 
享 数 据 库 的 完整 性 。 

另 一 种 方法 ， 即 数据 库 服务 器 体系 结构 ， 则 让 客户 端 管 理 用 户 界面 而 数据 库 服务 器 管理 数 
据 库 的 存储 和 访问 。 这 种 体系 结构 减少 了 网 络 流量 ， 降 低 了 对 每 个 客户 端的 计算 能 力 的 要 求 ， 
并 把 用 户 授权 、 完 整 性 检查 、 数 据 字 典 维护 以 及 查询 和 更 新 处 理 都 集中 在 数据 库 服务 器 上 。 

三 层 体系 结构 ， 即 除了 在 客户 端 和 数据 库 服务 器 两 层 之 外 再 增加 额外 服务 器 ， 人 允许 应 用 程 
序 代码 存储 在 额外 的 服务 器 上 。 这 种 体系 结构 可 以 在 额外 的 服务 器 上 执行 业务 处 理 ， 从 而 形成 
一 个 瘦 客 户 机 。 三 层 体系 结构 的 优势 是 具有 良好 的 可 伸缩 性 、 技 术 上 的 灵活 性 、 较 低 的 长 期 成 
本 、 系 统 与 业务 需求 的 更 好 配合 、 改 进 客 户 服务 、 提 高 竞争 优势 和 降低 风险 。 但 是 ， 较 高 的 短 
期 成 本 、 复 杂 的 工具 和 培训 、 有 经 验 人 员 的 短缺 、 不 兼容 的 标准 以 及 最 终 用 户 工 具 的 缺乏 都 是 
目前 使 用 三 层 体系 结构 或 n 层 体系 结构 所 面临 的 问题 。 

应 用 分 割 可 以 把 编写 好 的 部 分 应 用 程序 代码 分 配给 客户 端 或 服务 器 分 区 ， 以 便 实 现 更 好 的 
性 能 和 互 操作 性 。 应 用 程序 开发 人 员 的 生产 效率 会 随 着 应 用 分 割 的 使 用 而 得 到 提高 ， 但 开发 人 
员 必 须 深 入 了 解 每 个 流程 才能 正确 地 分 配 代码 。 

虽然 与 客户 /服务 器 体系 结构 的 广泛 采用 有 关 的 大 肆 宣 传 使 一 些 人 已 经 预言 大 型 主机 会 遭 
到 淘汰 ， 但 关键 任务 的 应 用 程序 仍 趋向 于 保留 在 大 型 主机 上 。 把 这 些 复杂 的 应 用 程序 转移 到 分 
布 式 客户 /服务 器 环境 并 不 是 轻而易举 的 。 并 行 处 理解 决 方案 的 应 用 使 得 集中 使 用 某 个 应 用 程 
序 或 数据 库 服务 如 更 具 吸 引力 。 

由 于 SQL 是 一 种 非 过 程 化 的 集合 处 理 语言 ， 所 以 已 经 证 明 它 适合 用 于 并 行 处 理 的 环境 。 我 
们 讨论 了 两 种 类 型 的 并 行 处 理 。 对 称 多 处 理 (SMP) 是 一 个 紧密 耦合 的 多 处 理 器 系统 ， 所 有 处 
理 器 之 间 共 享 公 共 的 内 存 。 当 对 共享 内 存 存在 极 多 的 内 存 请 求 时 ，SMP 系 统 可 能 会 出 现 IO 瓶 
人 须 问题 。 
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松散 耦合 体系 结构 (MPP) 为 每 个 CPU 设置 其 专用 的 内 存 。 这 种 类 型 的 体系 结构 通常 称 为 
无 共享 体系 结构 。 由 于 在 MPP 处 理 器 之 间 没 有 什么 资源 共享 ， 所 以 在 SMP 系 统 中 可 能 发 生 的 内 
存 争 用 问题 不 复 存 在 ， 而 且 有 可 能 在 某 个 单元 内 增加 节点 ， 从 而 使 MPP 结 构 极 具 可 伸缩 性 。 

中 间 件 是 允许 一 个 应 用 程序 与 其 他 程序 进行 互 操作 而 不 要 求 用 户 了 解 和 编码 实现 这 种 互 操 
作 性 所 需 的 低层 代码 的 某 种 类 型 的 软件 。 根 据 可 伸缩 性 和 可 恢复 性 ， 我 们 把 中 间 件 分 为 6 种 类 
别 。 这 些 中 间 件 类 型 包括 异步 的 远程 过 程 调用 (RPC)、 发 表 / 订 阅 . 面向 消息 的 中 间 件 (MOM )、 
对 象 请 求 代理 (ORB ) 、 面 向 SQL 的 数据 访问 中 间 件 以 及 间 步 ARPC。 面 向 数据 库 的 中 间 件 的 最 
新 发 展 还 包括 开放 数据 库 互 过 (ODBC)、Java 数 据 库 互 连 (JDBC) 以 及 微软 的 OLE-DB。 

把 数据 库 与 Web 连 接 ， 这 样 浏 览 器 可 以 通过 下 订单 、 访问 更 新 的 定价 信息 竹 等 与 Web 站 点 
实现 交互 ， 这 些 内 容 在 近 几 年 都 得 到 了 人 们 的 关注 。Web 正 在 改变 数据 的 分 布 模式 ， 随 着 浏览 
器 界面 的 使 用 ， 应 用 逻辑 会 了 迁移 到 更 集中 化 的 服务 器 上 。 

安全 问题 在 一 个 客户 /服务 器 环境 中 要 比 在 集中 式 环境 中 更 为 复杂 ， 因 为 除了 确保 客户 端 
工作 站 和 服务 器 的 安全 以 外 ， 还 必须 确保 网 络 安全 。 在 一 个 客户 /服务 器 环境 中 包含 的 安全 措 
施 包括 系统 层次 的 口令 安全 、 数 据 库 层次 的 口令 安全 以 及 安全 的 客户 /服务 器 通信 。 

应 当 得 到 解决 以 便 提高 建立 一 个 成 功 的 客户 /服务 器 应 用 程序 机 会 的 客户 /服务 器 问题 包括 : 
准确 的 业务 问题 分 析 、 详 细 的 体系 结构 分 析 、 避 免 工 具 驱 动 的 体系 结构 、 实 现 恰当 的 可 伸缩 性 、 
服务 的 恰当 放置 、 充 分 的 网 络 分 析 以 及 了 解 潜在 的 隐 含 成 本 。 

转 而 使 用 一 个 客户 /服务 器 环境 可 以 获得 的 好 处 包括 可 以 分 阶段 地 交付 功能 、 获 得 较 大 的 
灵活 性 、 可 伸缩 性 、 减 少 网 络 流 量 以 及 开发 启用 Web 的 应 用 程序 。 

大 多 数 客户 /服务 器 体系 结构 的 表示 服务 使 用 按 例 查询 (QBE) 界面 。QBE 提 供 了 -- 个 通常 
用 于 查询 开发 的 可 视 化 编程 环境 。QBE 并 不 存在 什么 标准 ， 因 此 不 同 产品 的 QBE 界 面 有 所 不 同 ， 
但 大 多 数 界面 会 利用 将 结果 布置 在 电子 表格 中 的 一 种 数据 模型 方法 。 微 软 公 司 Access 2000 的 
QBE 界 面 就 广泛 使 用 了 这 种 电子 表格 布局 ， 其 中 包括 表 和 查询 定义 以 及 建立 数据 联系 等 。 

这 种 不 够 强壮 的 关系 数据 库 软件 包 已 经 因为 它 的 图 形 用 户 界面 和 QBE 界 面 而 流行 开 来 。 例 
如 ， 微 软 Access 2000 使 用 传递 查询 来 直接 向 任何 兼容 开放 数据 库 互 连 (ODBC) 的 数据 库 服务 
器 传送 命令 。 如 果 数 据 库 兼 容 ODBC 或 兼容 JDBC ， 则 数据 库 的 表 可 以 链接 到 一 个 MS Access 
2000 的 应 用 程序 接口 。 必 须 确定 若干 个 参数 以 便 建立 一 个 DODBC 或 JDBC 的 连接 。 这 些 参数 包 
括 所 需 的 特定 CODBC 或 JDBC 驱 动 程序 、 后 端 数据 库 服务 器 的 名 称 、 数 据 库 的 名 称 以 及 数据 库 
用 户 的 ID 和 口令 。 对 于 ODBC 标 准 有 不 同 的 一 致 性 层次 ， 它 能 让 大 多 数 应 用 程序 与 期 望 数据 库 

与 Access 2000 相 关联 的 编程 语言 是 VBA。 使 用 Access 2000 的 宏 ( 即 VBA 代 码 的 预存 储 模 
块 ) 对 构建 原型 很 有 作用 ， 但 建立 一 个 强壮 的 应 用 程序 则 要 求 把 这 些 宏 转换 为 VBA 模 块 。 
VBA 还 能 用 来 实现 更 加 复杂 的 功能 、 处 理 错误 、 实 现 更 快速 度 的 执行 、 更 方便 的 维护 、 更 多 的 
OLE 自 动 处 理 以 及 更 多 的 程序 控制 。 


本 章 复 习 

关键 术语 
应 用 分 害 应 用 程序 接口 (API) 客户 /服务 器 体系 结构 
数据 库 服务 器 事件 驱动 胖 客户 机 
文件 服务 器 大 规模 并 行 处 理 (MPP) ”中 间 件 


开放 数据 库 互 连 (ODBC) 标准 。”” 按 例 查询 (QBE) 存储 过 程 
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对 称 多 处 理 (SMP) 瘦 客 户 机 二 层 体系 结构 
Visual Basic 应 用 程序 (VBA) 
复习 问题 
1. 定义 下 列 术 语 。 
a. 应 用 分 割 b. 应 用 程序 接口 《API ) 
c. 客户 /服务 器 体系 结构 d. 胖 客户 机 
e. 文件 服务 器 f. 中 间 件 
g. 存储 过 程 h. 三 层 体 系 结构 
i. 事件 驱 去 j. QBE 
k. 4 1. JDBC 
2. 将 下 列 术语 及 其 定义 匹配 起 来 。 
_ 客户 /服务 器 体系 结构 a. 一 个 负责 处 理应 用 逻辑 和 表示 逻辑 的 客户 机 
__ 应 用 程序 接口 (API) b. 一 个 用 来 处 理 某 应 用 程序 的 表示 层 和 若干 业务 逻 
辑 的 PC 
___ 胖 客户 机 c. 可 以 提高 互 操作 性 、 减 少 程序 员 编 码 工作 的 软件 
~ 数据库 服务 器 d. 侦 测 并 对 事件 作出 响应 
文件 服务 器 e. 若干 处 理 器 共享 公共 内 存 的 体系 结构 
-中 间 件 f. 负责 数据 库存 储 和 访问 
三 层 体系 结构 g. 将 应 用 程序 逻辑 组 件 进行 分 布 的 系统 
对 称 多 处 理 (SMP) h. 一 种 包含 直接 操纵 和 面向 可 视 化 的 编程 语言 
1. 


一 ”大 规模 并 行 处 理 (MPP) 负责 管理 文件 操作 ， 由 所 有 附属 的 客户 端 共享 





_ _ 瘦 客户 机 j. 无 共享 体系 结构 
-事件 驱动 k. 促进 前 端 程序 和 后 端 数 据 库 服务 器 通信 的 软件 
-传递 查询 1. 使 用 一 种 后 端 RDBMS 语 法 的 查询 

QBE m. 三 层 的 客户 /服务 器 配置 


3. 列 出 与 其 他 计算 方法 相 比 ， 客 户 /服务 器 结构 的 几 个 主要 优势 。 
4. 比较 下 列 术 语 : 
a. 对 称 多 处 理 (SMP) ; 无 共享 体系 结构 (MPP ) 
b. 文件 服务 器 ; 数据 库 服务 器 ; 三 层 体系 结构 
c. 客户 /服务 器 计算 ; 大 型 主机 计算 
d. 胖 客 户 机 ; 瘦 客 户 机 
e. 按 例 查询 ; 线性 模式 界面 
5. 描述 文件 服务 器 的 局 限 性 。 
6. 描述 数据 库 服 务 器 的 优势 和 不 足 。 
7. 描述 三 层 体系 结构 或 n 层 体系 结构 的 优势 和 不 足 。 
8. 应 用 程序 分 割 如 何 帮 助 开发 人 员 根 据 某 个 企业 的 情况 定制 一 个 应 用 程序 ? 
9. 描述 6 种 类 型 的 中 间 件 。 
10. Web 如 何 改变 数据 的 分 布 模式 ? 
11. 解释 QBE 与 SQL 相 比 的 长 处 和 不 足 之 处 。 
12. ODBC 规 范 的 目的 是 什么 ? 
13. 在 建立 一 个 启用 Web 的 数据 库 应 用 程序 时 会 出 现 哪些 安全 问题 ? 
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14. 解释 Access 2000 与 VBA 之 间 的 关系 。 
问题 和 练习 

1. 如 果 要 求 你 准备 一 份 报告 ， 就 处 理 用 于 所 有 分 支 机 构 的 一 个 新 的 客户 应 用 系统 的 各 种 可 
能 客户 /服务 器 解决 方案 作出 评估 。 你 将 会 评估 哪些 业务 特性 和 哪些 技术 特性 ”为 什么 ? 

2. 你 认为 在 引入 一 个 新 的 客户 /服务 器 体系 结构 时 哪些 管理 问题 比较 重要 ? 

3. 讨论 在 一 个 客户 /服务 器 数据 库 系统 中 应 当 建 立 哪些 不 同 的 安全 层次 。 

4. Web 如 何 影响 客户 /服务 器 数据 库 系统 ? 

5. 为 什么 ODBC 很 重要 ? 还 开发 了 哪些 其 他 的 连接 标准 ? 

6. 从 历史 来 看 ， 哪 些 类 型 的 应 用 程序 可 很 快 迁 移 到 客户 /服务 器 数据 库 系 统 ” 哪 些 类 型 系 
统 的 迁移 速度 较 慢 ?为 什么 ”你 认为 未 来 在 平衡 客户 /服务 器 数据 库 系 统 和 大 型 主机 数据 座 系 
统 时 会 发 生 什 么 ? 

7. 用 于 连接 数据 库 系统 的 中 间 件 的 优点 和 不 足 是 什么 ? 

问题 和 练习 8 ~ 12 要 根据 松 谷 家 具 公 司 数据 库 进 行 回 答 。 这 些 问 题 要 利用 QBE 界 面 来 完成 。 

8. 显示 订购 产品 3 或 产品 8 的 数量 超过 四 件 的 订单 号 、 顾 客 号 、 产 品 号 、 订 购 日 期 以 及 订购 
数量 。 

9. 显示 所 有 顾客 订单 的 顾客 号 、 姓 名 和 订单 号 ， 并 在 这 个 列表 中 显示 数据 库 中 没有 下 订单 

的 顾客 。 

10. 编写 一 个 查询 显示 每 个 产品 以 及 每 个 产品 的 订购 数量 ， 包 括 从 未 被 订购 的 产品 。 

11. 显示 一 个 所 有 产品 以 及 每 个 产品 订购 次 数 的 列表 。 

12. 显示 所 有 顾客 订单 数量 大 于 该 产品 平均 订购 数量 的 订单 号 、 产 品 号 和 订购 数量 。 提 示 : 
这 可 能 需要 多 次 查询 。 
应 用 练习 

1. 调查 你 的 大 学 所 使 用 的 计算 体系 结构 。 了 解 你 的 大 学 的 计算 体系 结构 的 发 展 历史 ， 并 确 
定 这 所 大 学 经 过 了 怎样 一 条 道路 才 达 到 目前 的 配置 状况 。 有 些 大 学 起 步 很 早 ， 它 们 拥有 大 型 主 


是 如 何 影响 目前 的 计算 环境 的 ? 

2. 我 们 缩小 一 下 规模 ， 调 查 你 所 在 大 学 某 个 系 的 计算 体系 结构 。 尝 试 说 明 目 前 的 系统 是 如 
何 满足 该 系 的 信息 处 理 需 求 的 。 

3. 采访 本 地 的 某 个 在 其 他 地 方 拥有 分 公司 的 企业 的 系统 专家 。 确定 该 组 织 的 计算 体系 结构 ， 
并 找 出 其 日 前 的 系统 是 如 何 满足 部 门 的 信息 处 理 需求 的 。 

4. 找 出 三 个 拥有 附属 于 该 站 点 的 交互 式 数据 库 的 Web 站 点 。 评 估 这 些 站 点 的 功能 ， 并 讨论 
交互 式 数据 库 系统 如 何 影响 其 功能 。 如 果 你 不 能 确定 从 何 处 着 手 ， 可 以 先 利用 以 下 网 址 : 
“http://www.amazon.com 来 分 析 。 

5. 找 出 你 所 在 地 区 的 两 家 相似 的 小 企业 , 但 它们 使 用 不 同 的 计算 机 系统 来 保存 他 们 的 记录 。 
比较 两 种 系统 的 功能 和 易 用 性 。 

6. 咨询 你 所 熟悉 的 某 个 企业 的 一 位 数据 库 分 析 师 或 系统 开发 员 。 调 查 该 企业 个 人 计算 机 和 
服务 器 数据 库 系统 的 使 用 情况 。 在 选择 一 个 数据 库 平台 时 会 考虑 什么 因素 ”该 企业 是 否 使 用 一 
种 混合 的 平台 ， 即 基于 客户 端的 应 用 程序 模块 是 用 某 种 语言 (比如 QBE) 编写 ， 而 服务 器 应 用 
程序 模块 则 用 另 一 种 语言 (比如 SQL) 编写 ?为 什么 选择 这 种 结构 ? 
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项 目 案例 : 山 景 社区 医院 


项 目 描述 

在 第 2 章 结尾 ， 我 们 了 解 到 山 景 社区 医院 特别 研究 小 组 正在 开发 一 项 长 期 业务 计划 。 规 划 
小 组 的 Heller 先 生 、Lopez 先 生 、Jefferson 博 十 以 及 一 位 顾问 正在 考虑 山 景 社区 医院 未 来 的 技术 
需求 。 目 前， 病人 们 必须 越过 一 个 包括 诸多 健康 计划 、 管 理 人 员 、 医 生 和 诊所 的 迷宫 ， 就 像 图 
9-21 所 示 的 迷宫 一 样 。 他 们 想 要 为 山 景 社区 医院 设计 一 个 能 够 集成 所 有 这 些 数据 (来 自 健康 计 
划 、 医 生 和 医院 系统 的 各 种 数据 ) 的 系统 ， 这 样 就 能 提供 准确 的 实时 信息 。 











健康 计划 











该 小 组 听 说 许多 医院 正 把 他 们 的 关键 任务 的 企业 级 系统 迁移 出 遗留 的 大 型 主机 系统 ， 并 移 
植 到 新 的 客户 /服务 器 系统 中 。 他 们 已 经 听 说 这 类 系统 能 够 提供 更 大 的 灵活 性 、 集 成 性 和 功能 。 
他 们 想 知道 这 些 系 统 是 否 能 够 集成 山 景 社区 医院 现 有 的 病人 账户 、 医 疗 管理 和 保险 系统 来 提高 
效率 和 支持 改善 的 医院 系统 。 顾 问 已 经 为 医院 草拟 了 一 份 可 能 的 客户 /服务 器 分 布 式 体系 结构 
图 ， 如 图 9-22 所 示 。 为 了 实现 向 客户 /服务 器 体系 结构 的 迁移 ， 该 小 组 考虑 了 如 下 所 述 的 二 种 
不 同 战略 。 

一 种 方法 是 购买 已 有 的 客户 /服务 器 应 用 程序 软件 包 ， 并 改编 它们 以 适合 山 景 社区 医院 的 
使 用 。 采 用 这 种 方法 可 以 使 山 景 社区 医院 现 有 的 管理 信息 系统 员工 能 尽快 熟悉 客户 /服务 器 环 
境 的 关键 部 分 ， 比 如 网 络 管理 、PC 配 置 管理 以 及 分 布 式 系统 管理 ， 而 不 必 在 他 们 已 有 的 工作 
之 外 再 管理 一 个 成 熟 的 大 规模 系统 开发 项 目 。 但 是 ， 他 们 考察 过 的 大 多 数 软件 包 都 要 求 使 用 专 
用 的 中 间 件 来 实现 客户 /服务 器 连接 。 这 家 医院 希望 建议 的 服务 器 能 够 继续 与 遗留 系统 建立 连 
接 ， 但 他 们 不 能 肯定 有 多 少 程序 可 供 使 用 以 便 让 他 们 迁移 到 希望 的 环境 。 

规划 小 组 考虑 的 另 一 种 方法 是 定制 开发 。 有 些 大 型 医院 已 经 对 他 们 新 的 客户 /服务 器 系统 
实施 了 定制 开发 。 这 项 任务 的 风险 很 大 ， 但 较 大 的 医院 已 经 承担 了 这 种 风险 ， 以 便 能 在 他 们 需 
要 时 得 到 数据 和 信息 。 山 景 社区 医院 的 规划 小 组 正在 考虑 承担 这 样 一 个 项 目的 风险 和 由 此 必需 
增加 MIS 员 工 的 需要 。 

他 们 考虑 的 最 后 一 种 方法 是 六 天 的 系统 基础 之 上 构建 客户 /服务 器 应 用 程序 。 工 作 流 应 
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用 程序 可 用 来 促进 前 端 界面 的 建立 。 随 着 该 小 组 逐步 实施 这 个 长 期 的 计划 ， 连 接 一 个 数据 仓库 
的 需要 也 变 得 越 来 越 明 显 ， 而 且 该 小 组 现在 想 要 规划 基础 设施 ， 以 便 轻松 地 建立 数据 仓库 。 





共 他 应 用 服务 


本 消息 服务 器 
文档 服务 器 上 [ 作 流 服务 党 










网 关 服 务 宫 












数据 库 








文件 “打印 / 传 服务 锅 
真 服务 癌 
应 用 服务 中 






客户 应 用 
程序 





网 络 和 系统 管 
理 控 制 台 





上 遇 层 或 : 居 
应 用 设计 


分 布 式 计算 基 
全 结构 















图 9-22 ”可 能 的 客户 /服务 器 分 布 式 体系 结构 (改编 自 Anderson and Armstrong,1995 ) 


当然 ， 山 景 社区 医院 也 可 以 采用 一 种 基于 Web 的 系统 。 这 样 该 诊疗 中 心 可 以 扩大 其 会 员 和 
病人 服务 的 范围 ， 扩 大 到 公司 、 学 校 和 家 庭 。 医 院 的 会 员 可 以 检查 他 们 的 保险 索赔 状态 ， 给 服 
务 代表 发 送 消息 并 查看 保险 范围 。 病 人 通过 访问 预约 时 间 安 排 可 以 自行 确定 预约 时 间 。 该 小 组 
的 成 员 们 不 能 肯定 这 些 新 服务 会 在 该 地 区 产生 什么 样 的 影响 ， 但 他 们 预期 其 他 某 些 医院 将 会 很 
快 采用 并 实施 这 些 举措 。 他 们 目前 正在 评估 他 们 的 其 他 选择 方案 ， 但 在 完成 进一步 的 研究 之 前 
( 即 第 10 章 结束 之 前 ) 会 考虑 这 个 最 新 的 选择 。 

项 目 问题 

1) 为 什么 山 景 社区 医院 的 规划 小 组 认为 创建 他 们 自己 的 定制 客户 /服务 器 应 用 程序 是 很 冒 
风险 的 ? 

2) 如 果 山 景 社区 医院 将 要 迁移 到 一 个 客户 /服务 器 环境 ， 那 么 处 理 和 提供 信息 会 有 什么 样 
的 可 能 性 发 生 ? 

3) 如 果 山 景 社区 医院 决定 采用 并 实施 商业 现 用 的 客户 /服务 器 应 用 程序 ， 他 们 必须 规划 什 
么 样 的 活动 ? 选择 其 中 一 个 活动 ， 比 如 病人 记 账 系统 ， 然 后 考虑 在 选择 、 安 装 和 使 用 这 样 一 个 
系统 时 会 包括 哪些 内 容 ? 

4) 你 认为 第 三 种 方法 ， 即 把 客户 /服务 器 应 用 程序 建立 在 现 有 系统 之 上 的 优势 和 不 足 是 什 
么 ? 

5) 你 认为 山 景 社区 医院 在 未 来 两 年 里 不 改变 他 们 目前 的 系统 会 有 哪些 优势 和 不 足 ? 

项 目 练习 

概括 说 明 你 认为 以 下 四 种 迁移 到 某 个 客户 /服务 器 环境 的 方法 各 有 什么 优 缺 点 : 定制 商业 
现 用 系统 (COTS )， 定 制 系统 开发 ， 在 现 有 基础 上 建立 ， 以 及 暂时 什么 也 不 做 ， 








第 10 章 ”因特网 数据 库 环境 


10.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

。 简 明定 义 下 列 关键 术语 : 万 维 则 、 电 子 商务 、 浏 览 器 、 电 子 业 务 、B2C、B2B、 防 火 墙 、 
代理 服务 器 、 万 维 网 联盟 、 超 文本 标记 语言 、 标 准 通 用 标记 语言 、 可 扩展 标记 语言 、 
XHTML、jJava、jJavaScript、VBScript、 层 胎 样 式 表 、 服 务 器 端 扩 展 、 公 共 网 关 接 口 、 
Java servlet、DNS 平 衡 、 软 硬件 负载 站 衡 、 逆 向 代理 、 插 件 、ActiveX、cookie、 
ColdFusion 标 记 语 言 、 路 由 器 、 非 法 入 侵 检测 系统 以 及 DCS-1000。 

。 解释 将 数据 库 连 接 到 Web 页 面 的 重要 性 。 

。 描 述 带 有 数据 库 连 接 的 因特网 和 内 部 网 的 基本 环境 。 

“恰当 使 用 因特网 相关 术语 。 

。 解 释 万 维 网 联盟 的 目标 和 已 取得 的 成 就 。 

。 解 释 服 务 器 端 扩 展 的 目的 。 

“比较 和 对 比 Web 服 务 器 接口 ， 包 括 CGI、API 和 Java servlet。 

* 描述 平衡 Web 服 务 器 负载 的 三 种 方式 。 

* 解释 插件 。 

* 解释 如 何 用 ColdFusion 或 ASP 实 现 简单 的 购物 车 应 用 程序 。 

。 讨论 Wweb 安 全 性 问题 。 

。 讨论 Web 保 密 性 问题 。 


10.2 引言 


随 着 万 维 网 (World Wide Web，WWW) 的 日 益 普及 ， 数 据 库 的 重要 性 也 日 益 凸 现 出 来 。 
电子 商务 (electronic commerce ，e-commerce ) ， 也 就 是 在 因特网 上 进行 交易 ， 已 经 成 为 驱动 万 
维 网 发 展 最 主要 的 原因 。 似 乎 从 AT&T 到 罗 丝 花 店 中 的 每 一 项 交易 都 在 迎接 着 一 种 新 的 挑战 ， 
那 就 是 调整 业务 以 充分 利用 全 球 网 络 (我 们 称 之 为 因特网 ) 的 优势 。 因 特 网 技术 在 公司 内 部 的 
应 用 ， 即 企业 内 部 网 ， 也 已 被 广泛 采用 。 

公共 的 因特网 和 私有 的 企业 内 部 网 可 以 被 看 作 是 一 种 巨大 的 客户 /服务 器 (Client/Server， 
C/S) 体系 结构 ， 该 结构 的 客户 机 (浏览 器 ) 很 瘦 而 服务 器 很 胖 。 服 务 器 把 信息 存储 在 数据 座 
中 ， 根 据 需要 传送 给 浏览 器 。 在 应 用 当中 ， 访 问 数据 库 的 当前 信息 (例如 库存 信息 ) 和 记录 信 
上 县 〈 例 如 与 订单 有 关 的 数据 项 ) 都 是 非常 必要 的 。 然 而 ， 如 果 开 发 人 员 没 有 意识 到 数据 的 安全 
性 问题 ， 那 么 把 数据 库 连 接 到 Web 应 用 上 就 可 能 会 导致 在 意 想 不 到 的 情况 下 开放 对 数据 库 的 访 
问 。 对 于 世界 各 地 的 客户 而 言 ， 新 的 在 线 购物 站 点 所 带 来 的 问题 是 显而易见 的 。 数 据 库 专业 人 
员 必 须知 道 怎 样 谨 慎 地 建立 、 操 作 和 管理 Web 与 数据 库 之 间 的 接口 。 

本 章 将 介绍 数据 库 与 因特网 应 用 程序 之 间 如 何 配合 ， 包 括 各 种 因特网 数据 库 体系 结构 ， 曾 
明 在 启用 web 的 数据 库 中 ASP 与 ColdFusion 的 使 用 ， 并 讨论 与 上 述 主题 相关 的 管理 问题 。 
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10.3 因特网 和 数据 库 连接 


Web 环 境 具 有 支持 快速 采用 和 实现 因特网 及 企业 内 部 网 业务 应 用 的 若干 特征 。 首 先 ， 浏 览 
器 (browser) 界面 简单 、 功 能 相似 ， 极 大 减少 了 刚 开 始 使 用 时 所 遇 到 的 障碍 (如 复杂 性 )。 就 
像 微软 的 Windows 操 作 系 统 使 用 方便 ， 人 们 可 以 轻松 学 习 新 的 Windows 应 用 程序 一 样 ， 最 流行 
的 浏览 器 界面 在 功能 上 都 很 相似 ， 这 使 得 用 户 在 浏览 器 之 间或 者 商业 站 点 之 间 进 行 切换 非常 便 
利 。 大 多 数 浏 览 器 窗口 的 顶部 会 显示 和 Windows 工 具 栏 功能 相似 的 工具 栏 ， 用 户 可 以 打印 当前 
页 或 拷贝 /粘贴 当前 页 上 的 信息 。 同 时 ， 大 多 数 浏览 器 者 支持 电子 邮件 、 即 时 消息 、Web 站 点 书 
签 以 及 Web 寻 址 和 搜索 。 采 用 本 章 后 面 将 要 介绍 的 HTML、DHTML.、 XML 和 JavaScript 使 浏览 
器 的 信息 表达 和 功能 具有 一 致 性 ， 站 点 之 间 的 切换 也 变 得 更 加 容易 。 

其 次 ， 由 于 浏览 器 的 软 硬 件 之 间 相 互 独 立 ， 所 以 跨 平台 的 信息 共享 也 相对 容易 ， 以 前 许多 
难以 解决 的 跨 平台 存 取 问题 也 得 以 解决 ， 特 别 是 使 得 广泛 访问 数据 库 信 息 也 成 为 可 能 。 借 助 因 
特 网 网 络 ， 已 经 可 以 做 到 存储 位 置 互相 独立 。 这 样 ， 通 过 使 某 些 信息 可 公开 访问 ， 而 把 关键 信 
息 放 在 防火 墙 后 面 或 者 放 在 另外 的 服务 器 上 以 防止 公共 存 取 ， 公 司 就 可 以 在 本 地 或 远程 站 点 访 
阿 他 们 的 数据 。 如 今 ， 借 助 于 因特网 移动 数据 文件 和 更 新 数据 库 已 经 变 得 非常 普遍 了 。 

最 后 ， 开 发 费用 和 时 间 也 得 以 降低 。 因 为 可 以 获得 便宜 甚至 是 免费 的 开发 以 及 开发 工具 ， 
所 以 减少 了 切入 该 领域 的 障碍 。 新 生 儿 可 以 拥有 他 们 自己 的 站 点 ， 该 站 点 由 他 们 的 父母 管理 。 
人 们 期 望 各 行 各 业 都 有 自己 的 站 点 ， 虽 然 这 些 站 点 的 功能 性 和 实时 性 各 不 相同 ， 但 找 不 到 其 个 
行业 站 点 的 机 会 还 是 很 少 的 。 同 时 ， 每 个 站 点 的 功能 和 处 理 速度 可 能 相差 很 大 ， 而 且 在 因特网 
上 可 获得 的 带宽 也 在 一 定 程度 上 决定 Web 页 的 显示 和 装载 速度 。 事 务 会 随 着 警戒 频率 而 终止 ， 
页 面 显 示 也 会 不 合 时 机 地 冻结 。 每 个 站 点 的 导航 逻辑 不 同 ， 并 且 也 不 是 很 明显 。 

许多 站 点 没有 与 其 相连 的 数据 库 ， 它 们 所 提供 的 仅仅 是 静态 信息 ， 这 些 静态 信息 采用 
HTML、JavaScript、CGI 或 其 他 脚本 语言 进行 编码 。 然 而 ,许多 站 点 都 需要 从 与 其 相连 的 数据 
库 中 提取 信息 或 向 其 中 存放 信息 。 有 一 些 站 点 只 是 信息 的 存储 库 ， 访 问 者 也 可 以 查询 这 些 存储 
库 。 在 访问 这 些 站 点 时 ， 用 户 可 以 提出 信息 请 求 并 阅读 所 获得 的 信息 ， 但 不 能 以 任何 方式 修改 
信息 。 例 如 ， 在 佛罗里达 州 的 Hillsborough 郡 ， 任 何人 都 可 以 查 到 谁 拥有 该 郡 的 上 地 ， 以 及 上 十 
地 税率 的 估计 、 以 往 购 买 价格 等 有 关 该 土地 的 详细 信息 。 信 息 存 放 在 访问 者 可 以 查询 的 数据 库 
中 ， 根 据 指定 的 记录 、 街 道 地 址 或 者 业主 姓名 等 属性 进行 访问 。 还 有 一 些 站 点 包含 产品 库存 信 
息 ， 这 些 信息 也 存储 在 数据 库 中 。 这 些 站 点 可 以 根据 访问 者 的 查询 ， 提 供 关于 特定 产品 或 产品 
类 别 的 信息 。 可 以 说 ， 任 何 存储 在 某 个 关系 数据 库 中 的 数据 都 可 以 被 连接 到 某 个 站 点 上， 你 可 
以 对 Web 站 点 进行 探测 来 验证 一 下 。 以 数值 、 字 符 或 图 形 的 方式 存储 数据 已 得 到 广泛 的 应 用 。 

另外 一 些 站 点 在 用 户 和 数据 库 之 间 提 供 了 更 多 的 交互 性 ， 用 户 可 以 把 信息 写 人 与 站 点 相连 
的 数据 库 中 。 由 于 客户 可 以 在 线 下 订单 ， 因 此 这 种 功能 成 为 电子 商务 爆炸 式 增长 的 有 力 支 持 。 
客户 经 常 在 下 订单 前 ， 需 要 确定 想 要 的 产品 是 否 有 现货 ， 以 及 收 到 该 产品 需要 多 长 时 间 。 所 以 ， 
电子 商务 应 用 必须 具有 显示 和 装载 与 站 点 相连 的 数据 库 的 能 力 。 

随 着 新 老 业务 开始 争 相 采用 上 述 技术 ， 术 语 电 子 业 务 e-business) 也 应 运 而 生 。 电 子 业 
务 摘 述 了 一 种 启用 技术 的 业务 ， 它 使 用 因特网 相关 技术 促进 顾客 与 供应 商 之 间 紧密 关系 的 进 一 
步 发 展 。 与 电子 商业 的 概念 相 比 ， 电 子 商务 较为 严格 ， 它 更 多 地 是 指 电子 业务 进行 过 程 中 所 发 
生 的 事务 。 

很 多 企业 认为 电子 业务 的 法 在 优势 包括 :改善 供应 链 管 理 、 改 善 客户 服务 、 缩 短 产品 上 市 
时 间 、 降 低 成 本 以 及 增加 销售 量 。 其 中 ， 一 些 日 标 比 另 一 些 目标 容易 达到 。 当 站 点 由 于 订单 多 
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而 发 生 堵 塞 时 ， 供 应 链 管理 问题 就 会 受到 很 多 负面 的 压力 。 另 外 ， 事 实证 明 ， 改 善 客户 服务 的 
代价 很 高 ， 我 们 中 的 很 多 人 可 能 都 向 商务 公司 发 送 过 请 求 ， 希 望 得 到 信息 或 支持 ， 但 没有 收 到 
任何 回音 。 所 以 说 ， 电 子 业务 的 获 利 能 力 还 难以 确定 。 

为 了 与 顾客 和 供应 商 之 间 达 到 无 颖 集成 ， 很 多 公司 作 了 努力 ， 因 此 出 现 了 电子 业务 的 两 个 
完全 不 同 的 类 别 : B2C (Business to Consumer) 和 B2B (Business to Business )。 它 们 也 被 称 作 
零售 电子 商务 和 商业 电子 商务 。B2B 的 接口 在 其 些 方面 比较 简单 ， 主 要 是 以 电子 方式 构建 已 有 
的 贸易 关系 。 已 经 证 实 ， 通 过 与 商业 伙伴 建立 在 线 贸易 ， 公 司 可 获得 巨大 收益 。 零 售 电 子 商 务 
则 必须 付出 更 多 的 努力 才能 让 顾客 在 线 下 订单 ， 因 为 交易 的 很 多 方面 涉及 安全 问题 ， 而 且 客 户 
可 能 还 设 做 好 访问 因特网 的 准备 ， 或 者 他 们 更 愿意 以 那 种 看 得 见 、 摸 的 着 的 方式 购买 商品 。 由 
于 利用 因特网 可 以 提高 业务 效率 、 改 善 客户 关系 ,已 实现 的 或 预期 的 效益 增长 会 驱动 这 个 与 数 
据 库 相 关 的 领域 继续 发 展 。 

10.3.1 因特网 环境 

因特网 体系 结构 在 后 面 将 会 详细 介绍 ， 本 节 只 是 让 读者 对 因特网 环境 有 初步 的 理解 。 图 10-1 
展示 建立 连接 数据 库 的 内 部 网 和 因特网 所 必须 的 基本 环境 。 右 侧 的 图 描述 了 内 部 网 。 从 图 中 可 
明显 看 出 该 结构 是 典型 的 C/S 体 系 结构 。 客 户 端 工作 站 与 Web 服 务 器 和 数据 库 服务 器 之 间 的 连接 
网 络 遵循 TCP/IP 协 议 。 其 中 ，TCP 代 表 传 输 控制 协议 ，IP 代 表 因 特 网 协议 。 对 于 各 种 因特网 传 
输 来 说 ,无论 是 发 送 电 子 邮 件 、 浏 览 Web， 还 是 用 作 Web 服 务 器 ， 这 两 条 协议 都 是 必须 遵守 的 。 
TCP 把 长 的 消息 分 成 由 小 的 数据 片段 组 成 的 多 个 包 ， 每 个 包 在 Web 上 独立 传送 ， 到 达 目 的 浏览 
僚 后 重新 装 起 来 并 显示 。 每 一 台 与 内 部 网 或 外 部 网 相连 的 计算 机 都 必须 有 不 同 的 下 地 址 。 如 果 
不 需要 连接 到 Web， 内 部 网 的 IP 地 址 就 不 需要 像 对 因特网 通信 网 络 开放 时 那样 设置 为 惟一 的 也 地 
址 。 在 第 9 章 中 描述 过 多 层 内 部 网 结构 ， 不 过 ， 图 10-1 所 显示 的 体系 结构 较为 简单 ， 在 这 种 结构 
中 ， 从 客户 浏览 器 发 出 的 请 求 通过 网 络 传输 到 Web 服 务 器 ， 而 服务 器 将 存储 返回 的 用 HTML 书 写 
的 页 面 并 显示 在 客户 浏览 器 上 。 如 果 所 发 送 的 请 求 需要 从 数据 库 中 获取 数据 ， 则 由 Web 服 务 器 
构建 一 个 查询 并 将 其 送 至 数据 库 服 务 器 ， 数 据 库 服 务 器 处 理 查询 ， 然 后 返回 查询 结果 。 同 样 ， 
输入 客户 端 工作 站 的 数据 也 可 以 通过 Web 服 务 器 被 送 到 数据 库 中 储存 起 来 ( Web 服务 器 将 数据 传 
送 到 数据 库 服 务 器 ， 数 据 库 服务 器 再 把 数据 提交 到 数据 库 )。 

上 述 处 理 流 程 同样 适用 于 与 外 部 网 相连 的 情形 ， 无 论 这 种 连接 仅仅 是 针对 特定 顾客 或 供应 
商 ， 还 是 任何 与 Web 相 连 的 工作 站 。 然 而 ， 对 外 开放 Web 服 务 器 需要 采取 一 定 的 数据 安全 措施 。 
在 企业 内 部 ， 通 常 由 数据 库 管 理 系 统 来 控制 对 数据 的 访问 ， 由 数据 库 管理 员 设置 员工 对 数据 的 
访问 权限 。 防 火 墙 (firewall) 则 是 用 来 限制 对 企业 内 部 数据 的 外 部 访问 ， 使 企业 数据 不 至 外 
泄 。 在 内 部 网 之 外 的 所 有 通信 都 通过 代理 服务 器 (proxy server) 来 完成 ， 由 它 来 控制 出 入 内 部 
网 的 消息 以 及 文件 的 传输 。 此 外 ， 代理 服务 器 还 可 以 通过 高 速 缓存 被 频繁 访问 的 页 面 ， 这 样 不 
必 连 接 Web 服 务 器 就 可 以 显示 被 请 求 的 页 面 ， 从 而 改善 站 点 的 性 能 。 

大 多 数 内 部 网 提供 如 下 服务 : 

“Web 服务 器 处 理 客户 机 请 求 并 向 客户 机 返回 HTML 页 面 。 

“ 数据 库 服务 ”提供 通过 Web 服 务 器 和 数据 库 服务 器 的 数据 库 访问 。 Web 到 主机 的 访问 能 够 

访问 存储 在 主机 上 的 遗留 数据 。 

* 目录、 安全 和 认证 服务 防止 对 内 部 网 进行 无 认证 访问 ， 并 提供 责任 追查 能 力 。 

* 电子 邮件 提供 内 部 网 、 外 部 网 、 因 特 网 上 计算 机 之 间 的 传递 消息 能 力 。 

“文件 传输 协议 (File Transfer Protocol, FTP) 提供 内 部 网 、 外 部 网 、 因 特 网 上 的 计算 机 

之 间 拷 贝 文件 的 能 力 。 用 户 需要 FTP 客 户 端 ， 远程 系统 需要 FTP 服 务 器 。 
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。 防 火 墙 和 代理 服务 器 提供 安全 措施 防止 外 界 非 法 入 侵 公司 内 部 网 。 

。 新 闻 组 或 讨论 组 ”提供 在 公众 可 访问 的 共享 公告 板 上 张贴 信息 的 功能 。 公 告 板 上 的 内 容 
包括 与 某 个 主题 (在 其 原始 位 置 被 标明 ) 相关 的 一 系列 讨论 。 

。 文 档 搜索 提供 搜索 Web 站 点 内 容 的 能 力 。 

。 负载 平 衡 和 高 速 缓存 分 散 繁忙 的 通信 流 ， 改 善 操作 性 能 。 
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图 10-1 带 有 数据 库 连 接 的 内 部 网 /因特网 环境 


10.3.2 术语 
信息 技术 的 每 一 个 发 展 阶段 都 会 产生 一 系列 新 的 术语 和 缩写 ， 网 络 与 因特网 的 引入 也 不 例 
外 。 除 了 前 面 介绍 的 有 关 术 语 以 外 ， 还 有 一 些 用 户 需 要 熟悉 以 下 一 些 与 Web 相 关 的 术语 。 
1. 与 通信 有 关 的 术语 
“1P 地 址 IP 地 址 由 四 个 0 ~ 255 的 数字 组 成 ， 它 们 之 间 用 句点 (小数点 ) 分 隔 ， 例 如 
131.247.152.18。IP 地 址 很 难 记 住 ， 不 过 每 个 IP 地 址 都 与 一 个 具有 实际 意义 的 域名 一 一 对 
应 ， 这 些 域名 便于 记忆 ， 例 如 www.usf.edu，www.udayton.edu 或 者 www.prenhall.com。IP 
地 址 的 索引 以 及 与 它们 相 匹 配 的 域名 则 由 域名 服务 器 进行 维护 。 
* 超 文本 传输 协议 (Hypertext Transfer Protocol, HTTP) ”这 是 一 个 将 浏览 器 的 请 求 传送 到 
Web 服 务 器 并 且 从 Web 服 务 器 将 页 面 传 回 浏览 器 的 通信 协议 。 然 而 ， 该 协议 不 是 特别 安 
全 ， 男 外 一 个 协议 一 一 HTTPS 可 提供 加 密 并 通过 安全 端口 传输 。 
。 统 一 资源 定位 器 (Uniform Resource Locator, URL) ， 它 是 一 种 指定 Web 服 务 器 的 通信 协 
议 及 其 JP 地 址 的 Web 地 址 表示 法 。 作 为 可 选项 ， 还 可 以 同时 指定 所 请 求 的 HTML 文 件 的 文 
件 夹 路 径 和 文件 名 。 图 10-2 显 示 了 一 个 典型 的 URL。 如 果 在 URL 中 没有 指定 通信 协议 ， 
则 HTTP 就 作为 默认 的 通信 协议 ; 如 果 没 有 指定 文件 夹 路 径 和 文件 名 ， 则 将 Web 服 务 器 的 
根 目录 作为 起 始 位 置 。 











tt 文件 炎 路 答 web 页 而 
通信 胁 议 域名 (本 迁 ] RTML 文件 
| | 


| | | | | 
http://www.w3.org/XML/1999/XML-in-10-points 
图 10-2 -个 典型 的 URL 





2. 与 Web 有 关 的 术语 

“静态 Web 页 面 ”内 容 在 写 的 时 候 就 已 经 确定 的 web 页面。 任何 时 候 访问 该 页 面 都 会 显示 
同样 的 信息 。 

“动态 Web 页 面 ”显示 符合 客户 端 请 求 /输入 的 数据 的 Web 页 面 。 通 常 ， 产 生动 态 Web 页 需 
要 数据 库 通过 打开 的 数据 库 连 接 附 加 在 页 面 上 。 请 参见 第 9 章 对 ODBC 连 接 的 讨论 。 


10.4 常见 的 因特网 体系 结构 的 组 成 


一 组 容易 让 人 混淆 的 技术 和 工具 (大 多 用 缩写 标识 ) 组 合 在 一 起 就 创建 出 因特网 环境 。 本 
他 讨 论 该 环境 中 最 常见 的 组 件 。 首 先 介 绍 创建 Web 页 面 的 各 种 语言 ， 有 时 还 可 以 结合 使 用 它们 。 
其 次 ， 讲 述 几 种 作为 Web 服 务 器 中 间 件 的 资源 。 这 些 处 理 请 求 或 者 来 自 Web 服 务 器 ,或 者 发 送 
到 Web 服 务 器 ， 进 而 可 将 其 区 分 为 服务 器 端 扩展 和 Web 服 务 器 接口 。 同 时 ， 还 讨论 Web 服 务 器 
和 客户 端 扩展 。 

图 10-1 只 是 给 出 因特网 环境 的 总 体 结 构 ， 并 没有 在 其 中 包含 组 件 并 把 它们 装配 起 来 。 此 外 ， 
使 用 宛 余 工 具 还 能 获得 各 种 不 同 配置 。 一 般 而 言 ， 同 一 类 的 Web 技 术 可 以 交替 使 用 ， 一 种 工具 
和 另外 一 种 工具 可 以 解决 同样 的 问题 。 比 如 在 本 章 末 屁 所 举 的 例子 中 ， 分别 采 用 ASP 和 
ColdFusion 技 术 将 Web 站 点 与 一 个 数据 库 连接 起 来 。 而 具体 选择 何 种 工具 则 由 需要 遵循 企业 的 
开发 标准 。 因 此 ， 必 须 首 先 了 解 某 类 工具 的 用 途 ， 以 便 知道 何 时 该 采用 它 。 其 次 ， 还 需要 一 本 
优秀 的 产品 参考 手册 ， 它 会 提供 语法 并 帮助 你 解决 接口 问题 。 

10.4.1 与 因特网 相关 的 语言 

万 维 网 联盟 (World Wide Web Consortium，W3C) 是 制定 HITP 和 HTML 标 准 的 主要 机 构 。 
W3C 由 Tim Berners-Lee 在 1994 年 创建 ， 是 一 个 国际 性 的 公司 联盟 。W3C 致 力 于 发 展开 放 式 标 
准 ， 这 些 开放 式 标准 促进 开发 Web 规 范 ， 使 Web 文 档 能 够 跨 平台 地 一 臻 显示。 他 们 还 提出 了 
XML 和 XHTML 规 范 ， 最 近 的 草案 是 2001 年 3 月 22 日 提出 的 一 整套 针对 XHTML 的 XML Schema 
模块 ， 以 及 一 个 扩展 和 修改 XHTML 的 框架 。 

用 于 创建 Web 文 档 的 基本 语言 是 HTML， 即 超 文本 标记 语言 (Hypertext Markup Language ) 
的 缩写 。HTML 与 标准 通用 标记 语言 (Standard Generalized Markup Language，SGML ) 类 似 ， 
SGML 描 述 文档 标记 元 素 的 规则 ， 从 而 使 标记 能 以 一 种 标准 方式 格式 化 。HTML 的 标记 规范 正 
是 基于 SGML 规 则 的 。 

HTML 是 一 种 脚本 语言 ， 为 了 显示 而 使 用 各 种 标记 和 属性 来 定义 Web 文 档 结构 及 布局 。 例 
如 ,一 个 HTML 文 档 以 标记 <HTML><HEAD> (在 这 里 输入 文档 主题 ) WHEAD><BODY> 开 始 ， 
需要 显示 的 信息 和 其 他 格式 标记 紧 随 其 后 ， 最 后 以 标记 </BODY></HTMEL> 结 束 。 

XML 是 一 种 正在 快速 发 展 的 脚本 语言 ， 它 也 是 基于 SGML 的 ， 它 与 XHTML 结合 使 用 可 能 
会 取代 HTML。XML 是 可 扩展 标记 语言 (Extensible Markup Language ) 的 缩写 ， 是 由 W3C 开 
发 的 另 -- 套 规范 。XML 专 门 用 王 Web 文 档 ， 它 人 允许 用 户 定义 自己 的 标记 。 这 些 标 记 可 以 跨 组 织 
使 用 ， 从 而 使 得 应 用 程序 之 间 和 组 织 之 间 的 数据 能 够 被 定义 、 传 输 、 验证 和 解释 。 经 证 明 ， 如 
果 要 在 Web 上 加 入 以 前 遗留 的 数据 ， 则 XML 非常 有 用 ， 因为 当 XML 标 记 在 遗留 数据 的 存储 器 
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中 格式 化 时 ， 可 以 用 来 定义 数据 ， 所 以 避免 了 重新 格式 化 。 

W3C 还 提出 了 一 种 混合 脚本 语言 规范 一 一 XHTML， 它 扩展 了 HTML 编 码 使 之 与 XML 兼 容 。 
XHTML 采用 三 种 XML 命名 空间 ， 这 三 种 命名 空间 与 HTML 4.0 的 二 种 数据 类 型 定义 (DTD ) 
相对 应 ， 它 们 分 别 是 Strict、Transitional 和 Frameset。 同 上 时， 由 于 XHTML 所 采用 的 模块 也 符合 
某 种 标准 ， 因 此 web 文档 的 布局 与 表示 仍然 是 跨 平 台 一 致 的 。W3C 的 希望 使 用 XHTML 取代 
HTML 成 为 标准 脚本 语言 ， 你 可 以 通过 访问 W3C 的 站 点 来 了 解 他 们 的 进展 。 

前 面 所 提 到 的 语言 都 属于 脚本 /标记 语言 ， 它 们 的 主要 功能 是 处 理 文档 的 布局 和 显示 ， 而 
不 能 编程 实现 某 种 功能 或 活动 。Java 则 是 一 种 非常 适 于 在 web 上 使 用 的 通用 编程 语言 。Java 
applet 是 一 种 Java 小 程序 ， 可 以 将 其 从 Web 服 务 器 下 载 到 客户 机 ， 在 与 Java 兼 容 的 Web 浏 览 器 
(如 Netscape Navigator 或 Microsoft Internet Explorer) 上 运行 它 。 

Java 是 一 种 面向 对 象 的 语言 ， 它 比 C++ 简 单 、 该 语言 是 由 Sun Microsystems 设 计 的 ， 最 初 的 
想法 是 设计 一 种 较 少 导致 常见 程序 错误 的 语言 。Java 的 源 代 码 文件 会 被 编译 成 一 种 叫做 字 节 码 
(bytecode ) 的 格式 ， 由 Java 解 释 程 序 执行 。 而 Java 的 解释 程序 和 运行 时 环境 ， 即 Java 康 拟 机 
(YM)， 在 大 多 数 操作 系统 中 都 存在 ， 因 此 编译 后 的 Java 代 码 可 以 在 大 多 数 系统 中 运行 。 字 节 
码 可 以 直接 转换 为 机 器 语言 指令 。 

Netscape 独 立 开 发 了 JavaScript， 它 的 许多 特性 和 结构 与 纯 Java 语 言 类 似 。 使 用 JavaScript 
编号 Web 文 档 可 以 获得 交互 性 ， 还 可 以 引入 动态 内 容 。 例 如 ， 鼠 标 滚动 、 内 容 被 更 新 的 自动 提 
示 、 通 过 艇 入 在 HTML 代 码 中 的 JavaScript 完 成 错误 处 理 ， 等 等 。 在 事件 发 生 时 ， 如 将 鼠标 滚动 
到 某 个 按钮 上 ， 就 会 激活 JavaScript。JavaScript 是 一 种 开放 式 语 言 ， 不 需要 许可 证 ， 当 前 的 
Netscape 和 微软 浏览 器 都 支持 它 。 

VBScript 与 JavaScript 类 似 和 JavaScript 基 于 Java 但 比 Java 简 单一 样 ， VBScript 也 基于 VB 但 
比 VB 简 单 。VBScript 可 以 在 Web 页 面 上 添加 按钮 、 滚 动 条 和 其 他 交互 式 控制 元 素 。 这 种 脚本 语 
言 由 微软 开发 并 且 可 以 在 微软 的 IE 浏 览 器 上 使 用 。 

层 友 样式 表 (Cascading Style Sheet，CSS ) 是 另外 一 种 由 W3C 开 发 并 添加 到 HTML 中 的 特 
性 。 利 用 CSS， 设计 人 员 和 用 户 可 以 创建 样式 表 ， 定 义 不 同 元 素 的 外 观 ， 如 报头 和 链接 的 外 观 。 
定义 完毕 之 后 ， 该 样式 表 就 可 以 应 用 到 任何 Web 页 面 上 。 其 实 ， 每 个 Web 页 面 上 还 可 以 应 用 多 
个 样式 表 。 目 前 已 经 发 布 了 两 种 W3C 推 荐 规范 (CSS1 和 CSS2)。 这 两 种 规范 在 大 多 数 浏览 器 
上 都 已 经 得 以 实现 ， 只 是 实现 的 程度 有 所 不 同 。 

10.4.2 服务 器 端 扩 展 

由 于 Web 服 务 器 只 能 理解 HTML 格 式 的 页 面 ， 所 以 为 了 处 理 来 自 客户 端 对 数据 库 的 访问 请 
求 ， 必 须 提高 或 扩展 Web 服 务 器 的 功能 。 服 务 器 端 扩展 (server-side extension) 其 实 是 一 个 程 
序 ， 它 直接 与 Web 服 务 器 交互 ， 以 处 理 各 种 请 求 。 例 如 ， 可 以 扩展 Web 服 务 器 功能 以 支持 数据 
库 请 求 ， 图 10-3 显 示 了 该 过 程 。 首 先 ， 浏 览 器 的 信息 请 求 通过 Web 提 交 到 Web 服 务 器 ; 脚本 中 
包含 SQL 查询 ， 但 是 Web 服 务 器 无 法 直接 解释 查询 ， 而 是 通过 Web- 数 据 库 中 间 件 识别 查询 ， 
并 准备 把 查询 传递 到 数据 库 管理 系统 和 存储 数据 项 的 数据 库 ; 查询 的 结果 返回 到 中 间 件 并 在 那 
里 进行 转换 ， 这 样 ， 当 Web 页 面 返回 客户 端 浏 览 器 时 才能 正确 显示 出 来 。 

服务 器 端 扩展 具有 极 大 的 灵活 性 。 网 络 管理 员 可 以 选择 任何 Web 服 务 器 (可 以 是 Netscape 
Fast Track Server 也 可 以 是 Microsoft Internet Information Server ) ， 也 可 以 采用 任何 有 SQL 功能 的 
兼容 ODBC 的 数据 库 (如 Oracle、Sybase 或 MS Access)， 中 间 件 则 与 两 者 相连 (ColdFusion 和 
Netscape Application Server 就 是 这 种 中 间 件 )。 使 用 ColdFusion 和 ASP 的 详细 例子 将 在 本 章 末尾 
介绍 。 
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10.4.3 ”Web 服务 器 接口 

为 了 使 Web 服 务 器 与 外 部 程序 进行 交互 ， 必 须 建立 适当 的 接口 机 制 。 无 论 使 用 的 术语 是 接口 、 
互 操 作 性 还 是 交互 性 ，Web 服 务 器 与 客户 机 (或 数据 库 ) 之 间 都 必须 有 通信 能 力 。 静 态 Web 页 面 
不 一 定 需 要 具备 这 种 类 型 的 接口 ， 因 为 所 有 要 显示 的 信息 都 已 存储 在 HTML 文 档 中 。 然 而 ， 动 态 
Web 页 面 只 有 在 客户 端 浏览 器 请 求 某 个 页 面 时 ， 才 能 决定 将 要 显示 的 内 容 。 例 如 ， 显 示 某 些 被 更 
新 的 信息 (如 产品 当前 的 库存 量 ) 时 就 需要 Web 服 务 器 接口 。 常 见 的 Web 服 务 器 接口 有 以 下 两 种 : 

。 公 共 网 关 接 口 (Common Gateway Interface，CGI)。 

*。 应 用 程序 接口 。 

CGI 指 定 Web 服 务 器 和 CGI 程 序 之 间 的 信息 传输 模式 。CGI 程 序 用 来 接收 和 返回 数据 ， 它 可 
以 用 任何 能 产生 可 执行 文件 的 语言 编写 ， 这 些 语言 包括 C 或 Ct++、Perl、Java 或 Visual Basic 等 。 
不 过 ，CGI 程 序 所 处 理 的 数据 必须 遵循 CGI 规 范 。 通 常 ， 浏 览 器 上 会 显示 一 些 表单 ， 由 用 户 填 
写 ， 而 CGI 程 序 用 来 接收 这 些 表单 中 的 数据 。 当 然 ，CGI 程 序 也 可 以 用 来 接收 遗留 系统 中 的 数 
据 ， 例 如 某 个 已 有 数据 库 或 其 他 的 文档 等 。 需 要 注意 的 是 ， 网 关 程序 属于 可 执行 程序 ， 它 能 够 
在 不 同 的 信息 服务 器 下 交替 运行 。 

CGI 程 序 是 Web 服 务 器 与 用 户 请 求 之 间 进 行动 态 交 互 的 常用 方式 ， 还 有 其 他 一 些 客户 端 方 
法 会 在 后 面 的 内 容 中 陆续 讲 到 。CGI 脚 本 存储 在 Web 服 务 器 上 ， 并 且 在 用 户 发 出 使 用 该 CGI 丢 
本 的 请 求 时 执行 。 如 果 很 多 用 户 同时 发 出 使 用 CGI 脚本 的 请 求 ， 则 服务 器 性 能 就 会 发 生 显著 下 
降 。 为 解决 这 个 问题 ， 相 继 出 现 了 一 些 服务 器 端 解决 方案 ， 如 Java 脚 本 和 applet、ActiveX 控 件 
等 ， 这 些 内 容 在 后 面 的 部 分 中 将 会 一 一 讨论 。 

除了 CGI 程序 以 外 ，Java servlet 是 Web 服 务 器 接口 的 另 一 个 选择 。 与 applet 相 同 ，servlet 
不 是 在 操作 系统 而 是 在 其 他 应 用 程序 中 执行 的 程序 ， 但 它们 存储 在 服务 器 上 而 不 是 和 应 用 程序 
一 起 存储 在 客户 端 。servlet 允 许 客户 端 程序 向 服务 器 上 载 额外 的 程序 代码 ， 并 且 在 服务 器 上 执 
行 代码 。 因 为 servlet 的 文件 尺寸 很 小 ， 而 且 可 以 跨 平台 兼容 ， 所 以 作为 浏览 器 的 因特网 小 应 用 
程序 非常 理想 。Java servlet 是 持续 的 ， 一 旦 被 启用 ， 它 们 就 驻 留 在 活动 内 存 中 ， 并 且 能 够 完成 
多 个 请 求 。 而 CGI 程序 在 运行 后 关闭 ， 所 以 Java sevlet 更 加 有 效 ， 而 且 因 为 它 是 持续 的 ， 所 以 
服务 器 性 能 也 不 大 会 受 其 影响 。 

应 用 程序 接口 (Application Programming Interface, API) 也 比 CGI 技 本 更 加 有 效 ， 一 般 将 
API 实 现 为 共享 代码 或 动态 链接 库 (DLL)。 这 就 意味 着 代码 驻 留 在 内 存 中 ， 并 可 以 根据 需要 动 
态 调用 。 对 每 个 请 求 而 言 ， 不 需要 执行 任何 外 部 程序 。-- 个 API 是 一 组 例 程 、 协议 和 工具 ， 应 
用 程序 用 它 来 控制 操作 系统 过 程 的 性 能 。 AP1 也 可 以 使 用 共享 的 数据 库 连 接 ， 而 不 需要 在 每 次 
请 求 连 接 时 都 建立 一 个 新 链接 。 不 过 ，API 也 有 一 些 缺 点 。 因为 它 驻 留 在 Web 服 务 器 上 ， 所 以 
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一 个 API 错 误 可 能 会 导致 服务 器 月 注 。 此 外 ，API 对 于 其 驻 留 的 操作 系统 和 Web 服 务 器 而 言 是 特 
定 的 ， 如 果 要 在 其 他 系统 上 运行 就 必须 重 写 API。 
10.4.4 Web 服 务 器 

这 里 介绍 一 个 有 趣 的 Web 站 点 : www.netcraft.com/survey/， 该 站 点 每 个 月 对 所 能 识别 的 因 
特 网 Web 服 务 器 都 进行 一 次 调查 。1995 年 ， 它 第 一 次 调查 了 3428 个 站 点 ; 到 了 2001 年 4 月 ， 这 
个 数字 已 经 达到 28 669 939 个 。 站 点 数目 的 指数 级 的 增长 取决 于 两 个 方面 的 能 力 : 一 是 与 数据 
库 通 信 的 能 力 ， 二 是 提供 包含 当前 信息 的 动态 页 面 的 能 力 。 这 些 站 点 都 能 提供 HTTP 服 务 ， 该 
协议 允许 Web 浏 览 器 和 Web 服 务 器 之 间 进行 通信 。HTTP 是 一 个 相对 简单 的 协议 ， 通 过 TCP 连 接 
传递 纯 文本 。 起 初 ， 对 每 个 需要 下 载 到 浏览 器 的 对 象 ， 都 需要 建立 一 个 新 的 HTTP 连 接 。 现 在 ， 
新 版 本 的 HTTP 支 持 持 续 连 接 ， 因 此 ， 多 个 对 象 就 能 够 以 包 的 形式 通过 单个 TCP 连 接 进行 传输 。 

借助 于 多 线程 /多 处 理 技术 ，Web 服 务 器 能 够 同时 为 多 个 用 户 提供 服务 。 运 行 在 Unix 之 上 的 
web 服务器 通常 采用 多 处 理 技术 ， 而 其 他 服务 器 则 采用 多 线程 技术 、 多 处 理 技术 或 二 者 的 混合 。 
多 处 理 技术 通过 串联 多 个 处 理 器 达到 快速 处 理 的 目的 。 一 个 线程 是 一 个 较 大 程序 的 一 部 分 ， 多 
线程 技术 就 是 同时 运行 多 个 线程 的 技术 。 

流行 Web 站 点 被 点 击 的 频率 往往 会 超过 单个 服务 器 的 管理 能 力 , 因此 必须 安装 多 台 服 务 器 。 
此 时 ， 如 何平 衡 负 载 以 充分 利用 各 服务 器 就 成 为 一 个 关键 问题 。 一 些 站 点 采用 域名 服务 器 平衡 
(domain name server balancing，DNS 平衡 ) 处 理 大 量 的 点 击 ， 在 分 开 但 却 相 同 的 物理 服务 器 
上 放置 站 点 的 多 个 拷贝 。 站 点 主机 名 的 DNS 服务 器 返回 站 点 的 多 个 了 P 地 址 ， 可 以 对 该 主机 名 返 
回 多 个 下地 址 ， 也 可 以 对 所 收 到 的 每 个 DNS 请 求 返回 不 同 的 IP 地 址 。 这 种 方法 虽然 简单 ， 但 因 
为 IP 地 址 的 选择 不 一 定 平衡 ， 所 以 也 不 能 确保 服务 器 上 的 负载 是 平衡 分 配 的 。 

软 硬 件 负载 平衡 (software and hardware load balancing) 能 够 更 为 平均 地 在 Web 服 务 器 之 间 分 
配 请 求 。 在 这 种 情况 下 ， 站 点 仅 有 一 个 公开 的 节 地 址 ， 对 该 卫 地 址 的 请 求 在 TCP/IP 路 由 层 被 分 配 
到 驻 留 站 点 的 各 个 服务 器 中 。 采 用 这 种 方法 所 达到 的 负载 平衡 通常 比 DNS 方法 好 。 还 有 一 些 负 
载 平衡 器 检测 到 池 中 的 Web 服 务 器 停机 时 ， 可 以 把 请 求 动态 重 定向 到 另外 一 台 Web 服 务 器 上 。 

第 三 种 方法 通过 中 途 截取 来 自 客户 端的 请 求 并 且 在 将 响应 返回 客户 端的 Web 服 务 器 中 高 速 
缓存 响应 来 减少 负载 。 这 种 方法 叫做 逆向 代理 (reverse proxy)， 即 由 代理 在 自 己 的 本 地 高 速 组 
存 中 处 理 请 求 ， 而 不 与 Web 服 务 器 连接 ， 从 而 减少 Web 服 务 器 的 负载 。 

某 些 公司 采用 全 局 负载 平衡 技术 ， 这 种 技术 在 全 球 范围 内 对 数据 文件 的 发 送 进行 分 配 。 通 
常 ， 他 们 同时 采用 DNS 负载 平衡 技术 和 软 硬 件 负载 平衡 技术 ， 通过 判断 客户 端的 位 置 ， 把 距离 
用 户 最 近 的 文件 提供 给 用 户 。 

现在 ，Web 服 务 器 有 时 也 提供 XML 数据 和 HTML 数 据 ， 起 着 应 用 服务 器 的 作用 ， 因 此 ， 
Web 服 务 器 与 应 用 服务 器 之 间 的 差别 也 变 得 不 那么 清晰 了 。 另 一 方面 ， 应 用 服务 器 也 可 以 配置 
为 一 个 简单 的 Web 服 务 器 ， 但 它 还 是 作为 一 个 应 用 服务 器 来 使 用 。 如 何 配置 Web 站 点 取决 于 该 
站 点 的 应 用 情况 。 如 果 某 个 web 站 点 需要 从 一 个 应 用 中 传送 大 量 数据 ， 那么 它 最 好 同时 具备 一 
个 Web 服 务 器 和 一 个 应 用 服务 器 ; 而 对 于 那些 传递 不 需要 频繁 依赖 于 某 个 应 用 的 HTML 页 面 的 
站 点 ， 有 一 个 具有 应 用 服务 器 功能 的 Web 服 务 器 就 足够 了 。 

10.4.5 客户 端 扩展 

所 谓 客户 端 扩 展 就 是 向 浏览 器 增加 功能 。 本 节 简 要 介绍 几 种 最 流行 的 方式 ， 包 括 插件 、 
ActiveX 控 件 、cookie 等 ， 以 帮助 读者 理解 什么 是 客户 端 扩展 。 

插件 (Plug-ins ) 是 指 为 了 扩展 浏览 器 的 最 初 功能 而 添加 某 种 特征 或 服务 的 硬件 /软件 模块 。 
通过 把 某 个 插件 下 载 到 浏览 器 的 插件 文件 夹 并 进行 安装 ， 就 可 以 获得 客户 端 扩 展 。 例 如 ， 利 用 
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RealAudio 插 件 能 够 收听 Web 上 的 音频 广播 ， 利 用 Shockwave 插 件 能 够 播放 动画 文件 ， 还 有 掌上 
电脑 与 PC 同步 、 无 线 访问 、 加 密 等 插件 。 尽 管 持 件 最 初 是 遵循 Netscape Navigator 规 范 而 设计 
的 ,但 它 也 同样 适用 于 Microsoft IE 和 其 他 浏览 器 。 不 过 ，Microsoft IE 除了 支持 大 多 数 
Netscape Navigator 捅 件 以 外 ， 也 开发 了 一 个 自己 的 软件 标准 一 一 ActiveX ， 用 来 取代 插件 。 
ActiveX 将 在 后 面 的 内 容 中 介绍 。 同 样 ，Netscape Navigator 也 支持 一 些 ActiveX 控 件 。 

大 多 数 播 件 都 是 免费 的 ， 而 且 它 们 的 尺寸 很 小 ， 便 于 下 载 。 尽 管 如 此 ， 有 时 用 户 还 是 会 拒 
绝 添 加 插件 ， 因 为 插件 可 能 会 使 浏览 器 或 PCL 不 期 望 的 方式 运行 。 基 于 这 种 情况 ， 同 时 考虑 
到 插件 可 能 会 妨碍 搜索 引擎 选择 公司 站 点 ， 所 以 公司 可 能 不 会 在 其 站 点 上 使 用 插件 。 此 外 ， 与 
其 他 外 部 开发 的 功能 一 样 ， 最 流行 的 插件 会 集成 到 浏览 器 的 未 来 版 本 中 。 

ActiveX 是 由 微软 开发 的 一 套 松 散 定义 的 技术 ， 它 来 源 于 其 他 两 项 微软 技术 一 一 OLE 
(Object Linking and Embedding) 和 COM (Component Object Model)。ActiveX 控 件 对 浏览 器 
进行 扩展 ， 并 且 可 以 操纵 浏览 器 的 内 部 数据 。 它 们 是 微软 发 布 的 OLE 控 件 的 第 3 版 ， 通 过 使 用 
COM 技 术 ， 可 以 提供 与 其 他 类 型 COM 组 件 及 服务 进行 协同 工作 的 能 力 。 例 如 ， 允 许 用 户 在 运 
行 控件 之 前 明确 控件 的 作者 、 这 是 重要 的 Web 安 全 特性 。COM 体 系 结构 可 以 在 所 有 微软 产品 上 
工作 ， 产生 具 有 标准 接口 的 对 象 ， 因 此 可 以 用 在 任何 兼容 COM 的 程序 当中 。 通 常 使 用 C++ 或 
Visual Basic 编 写 ActiveX 控 件 。 

当 用 户 重新 访问 某 个 Web 站 点 时 ，cookie 可 以 用 来 验证 用 户 身份 。 一 般 而 言 ，Web 站 点 会 
要 求 访问 者 填写 一 个 表单 ， 内 容 包 括 姓名 、 电 子 邮件 和 其 他 一 些 信息 (邮政 地 址 、 电 话 、 与 站 
点 相关 的 兴趣 爱好 等 )。 用 户 提供 的 数据 存储 在 cookie 中 并 发 送 到 Web 浏 览 器 。 当 用 户 再 次 访问 
该 站 点 时 ，cookie 的 内 容 就 会 被 送 回 服务 器 并 返回 定制 的 Web 页 面 。 由 于 Cookie 可 以 在 浏览 器 
上 和 存储 相当 长 时 间 ， 所 以 它 是 持久 的 。 拒 绝 提 供 相关 信息 的 用 户 可 以 选择 不 在 他 们 的 Web 浏 览 
器 上 存储 cookie。 


10.5_ Web- 数据 库 工 具 : ColdFusion 与 ASP 


现在 ， 数 据 库 与 Web 应 用 之 间 的 连接 可 以 用 很 多 中 间 件 应 用 程序 来 实现 ， 其 中 ，ColdFusion 
和 ASP (Active Server Page， 微 软 的 活动 服务 器 页 面 ) 最 为 流行 。 还 有 其 他 一 些 产品 在 2001 年 的 
中 期 开始 受到 关注 ， 如 Cocoon、 元 素 构造 集 ( Element Construction Set， ECS )、 可 扩展 标记 语言 
编译 器 (eXtensible Markup Language Compiler，XMLC)、 可 扩展 样式 表 语 言 转换 (eXtensible 
Stylesheet Language Transformation ，XSLT) 和 Java 服 务 器 页 面 (Java Server Page，jJSP)。 以 下 主 
要 从 三 个 方面 讨论 上 述 各 种 产品 的 品质 : 所 需 编码 的 数量 与 性 质 、 可 移植 性 、 编 译 器 需求 。 

首先 ， 为 了 帮助 读者 理解 数据 库 与 Web 页 面 的 连接 ， 下 面 引 入 一 个 简单 的 购物 车 示例 。 在 这 
个 例子 中 既 可 以 使 用 ASP 也 可 以 使 用 ColdFusion 4.0。 该 购物 车 应 用 程序 允许 在 Web 站 点 上 选择 项 
目 并 下 订单 ， 其 中 附带 一 些 理解 连接 过 程 所 必须 的 代码 。 使 用 ASP 或 ColdFusion 实 现 购物 车 应 用 
程序 的 完整 脚本 文件 和 指令 可 以 从 以 下 Web 站 点 获取 : www.prenhall.comyhuffer。 需 要 说 明 的 一 点 
是 ， 该 示例 仅仅 展示 如 何 从 连接 数据 库 中 获取 数据 ， 而 并 没有 存储 订单 信息 或 接受 信用 卡 信息 。 

ASP 和 ColdFusion 都 允许 在 HTML 文 件 中 自 定义 标记 ， 这 些 定制 标记 使 得 服务 器 端 能 够 产 
生动 态 Web 页 面 。ColdFusion 页 面 以 扩展 名 为 .cfm 的 脚本 文件 格式 存储 ， ASP 则 以 扩展 名 为 .asp 
的 脚本 文件 格式 存储 。 
10.5.1 ASP 示例 

ASP 由 文本 文件 组 成 ， 其 中 包含 文本 、HTML 和 脚本 语言 命令 (通常 是 JavaScript 或 
VBScript)。 由 于 这 些 文件 在 服务 器 上 执行 ， 客户 端 平台 只 是 显示 服务 器 端 处 理 的 结果 ， 所 以 
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程序 员 不 必 关 心 客户 端 平台 。ASP 通 过 它们 的 扩展 名 .asp 来 确定 。 与 其 他 URL 一 样 ，ASP 可 以 
通过 Web 浏 览 器 访问 ， 如 通过 微软 的 IE 或 Netscape Navigator 来 访问 。 

请 求 ASP 文 件 会 使 服务 器 处 理 所 有 和 髓 入 到 页 面 中 的 脚本 命令 ， 生 成 HTMEL 文 档 ， 并 把 该 
HTML 文 档 返 回 到 客户 端 加 以 显示 。 

这 里 所 列举 的 简单 的 ASP 购 物 车 示例 包含 一 个 全 局 文件 和 6 个 .asp 文 件 : 

* global.asa 一 一 每 个 ASP 应 用 程序 必须 包含 一 个 global.asa 文 件 。 读 文件 既 管理 应 用 程序 ， 

也 管理 从 客户 端 开始 的 任何 会 话 。 

显示 购物 车 的 内 容 ， 并 负责 添加 或 删 减 购物 车 中 的 项 目 。 
接受 购物 者 信息 并 完成 订单 ， 但 没有 考虑 订单 存储 和 信用 卡 处 理 。 

"item.asp 一 一 显示 特定 项 目的 信息 〈 某 件 家 有 具 )， 提 供 可 以 链接 到 搜索 框 和 主 区 域 的 选项 。 

“line.asp 一 一 显示 在 某 次 购物 结束 时 得 到 的 所 有 产品 的 列表 ， 人 允许 访问 搜索 框 。 

。 search.asp 显示 与 搜索 参数 Product_t.Product_Description 相 匹配 的 产品 列表 ， 搜 索 参 

数 由 表格 中 的 字段 serarchval 决 定 。 

“store.asp 一 一 松 谷 家 具 公 司 ASP 购 物 车 演示 程序 的 主页 。 可 以 使 用 搜索 工具 查找 特定 项 目 ， 

并 且 列 出 所 有 不 同 的 、 可 以 购买 的 成 品系 列 。 

在 文件 globalasa 中 指定 事件 脚本 ， 并 且 声 明 ASP 应 用 程序 中 各 个 页 面 可 以 访问 的 对 话 和 应 
用 程序 对 象 。 图 10-4 说 明 在 购物 车 应 用 程序 中 使 用 的 global.asa 文 件 ， 该 文件 必须 存放 在 ASP 应 
用 程序 的 根 目 孙 下 。 每 个 ASP 应 用 程序 只 能 有 一 个 global.asa 文 件 ， 其 中 可 放置 开始 /结束 应 用 
程序 和 会 话 的 指令 。 在 本 例 中 ， 开 始 一 个 新 会 话 就 意味 着 开始 一 个 响应 客户 请 求 的 购物 车 ， 其 
中 包含 一 个 可 以 跟踪 定货 数量 的 变量 。 


<SCRIPT LANGUAGE=VBScript RUNAT=Server> 








scart.aSp 





。checkout.asp 














‘You can add special event handlers in this file that will get run automatically when 
‘special Active Server Pages events occur To create these handlers, just create a 
‘subroutine with a name from the list below that corresponds to the event you want to 
‘use. For example, to create an event handler for Session_OnStart, you would put the 
‘following code into this file (without the comments): 


Sub Session_OnStart 
Put your code here ** 
Session(“Cart”) ‘ Tracks what they want to order 


Session(“Count") ' Tracks the quantity that they want 





End Sub 

'EventName Description 

'Session_OnStart Runs the first time a user runs any page in your application 
‘Session_OnEnd Runs when a user's session times out or quits your application 


Application_OnSiart ”Runs once when the first page of your application is run for the first 
time by any user 
Application_OnEnd Runs once when the web server shuts down 


</SCRIPT> 








图 10-4 global.asa 


图 10-5 列 出 购物 车 应 用 程序 6 个 .asp 文 件 中 的 store.asp， 其 余 的 5 个 文件 以 及 在 PC 上 的 安装 
各 令 可 以 登录 站 点 www.prenhall.cormyhoffer 获 取 。 store.asp 是 松 谷 家 具 公 司 购物 车 的 主页 ， 它 展 
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示 出 很 多 不 同 的 ASP 功 能 ， 可 以 帮助 读者 理解 ASP 应 用 程序 如 何 把 一 个 数据 库 连 接 到 应 用 程序 
上 。 如 果 读 者 使 用 运行 Windows 操 作 系统 的 PC， 那 么 可 以 采用 个 人 Web 服 务 器 (Personal Web 
Server) 安装 购物 车 程序 运行 的 测试 环境 。 









<%@ language=VB Script %> 


<% 
option explicit 

REM designed by: Michael Alexander 

REM Project: Pine Valley Furniture Demo, ASP 
REM Purpose: Store Entrance 















REM This page provides entrance to the Pine Valley Furniture Store 
REM asp demo version. it provides the user with a search tool to 
REM search for a specific item. it also has a listing of all the 

REM different Finish “Lines” available for purchase. 

%> 












<% 
Dim conn 

Dim rsRes 

Dim strSQL 

REM Set up Database connection 

set conn = server.CreateObject (‘adodb.connection") 
conn.Open “PYVFMDB" 

%> 










<HTML> 


<HEAD> 
<META NAME="GENERATOR"” Content="Microsoft Visual Studio 6.0"> 
<TITLE>Pine Valley Furniture Company Web Store</TITLE> 
<HEAD> 
<BODY bgcolor=#ffffcc text=#00008b> 
<TABLE align=center> 
<TR> 
<TD><STRONG><FONT size=6>Welcome to the Pine Valley Furniture Store 
</FONT></STRONG></TD> 
</TR> 
</TABLE> 
<HR><BR><BR> 
<TABLE> 
<TR> 
<TD valign=top align=center> 
<B>Search for a product such as bookcase, nightstand, or table:</B><BR> 


<FORM action="search.asp" method=post> 
<INPUT Name="searchval” type=text width=20><BR><BR> 
<INPUT Value="SEARCH!" type=submit><BR> 
<FORM> 






<% lf Session(“Cart”) <> * Then %> 






<FORM method=post action=cart.asp> 
<INPUT type=Hidden name=Quantity value=0> 
<INPUT type=Hidden name=item value=—0> 
<INPUT type=Hidden name=none value=0> 
<INPUT type=Submit value="Go to Cart”> 

</FORM><BR> 

<9% End if %> 









图 10-5 store.asp 
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</TD> 
<TD align = center valign=top width=100> 
<B>On search by product finish:</B><BR><BR> 








<% 
REM Get a tist of Finishes 









strSQL = “SELECT Product_Finish FROM PRODUCT _t GROUP BY Product_Finish;” 
set rsRes = conn.Execute(strSQL) 
9%> 





<TABLE> 






<% 

REM Display the list of Finishes 
While not rsRes.EOF 
9%> 


<TR> 









<TD align=center valign=top> 
<W%—rsRes(*Product_Finish"}%><JTD> 






<TD> 






<FORM method=post action="line.asp”> 
<INPUT type=Hidden name=-line 
value="<%=rsRes("Product_Finish")%>"> 
<NPUT type=submit Value=GOI> 
<FORM> 













</TR> 
<% 






rsRes.MoveNext WEnd 






</TABLE> 


</TR> 
</TABLE> 


图 10-5 ( 续 ) 

下 面 对 图 10-5 作 一 些 说 明 。 

Box A 使 用 ASP 标 记 (<% %>) 向 服务 器 指明 ASP 应 用 程序 将 使 用 VBScript， 并 且 应 该 进 
行 相应 的 解释 。Box B 包 含 一 条 命令 “option explicit" ， 这 意味 将 通过 Dim 语 句 显 式 声明 所 有 变 
量 。 使 用 Option Explicit 很 容易 发 现 拼写 错误 的 变量 名 。Box C 显 式 声 明 变量 并 建立 数据 库 连 接 。 
注意 ， 数 据 库 名 为 “PVEFEMDB”， 在 建立 ODBC 连 接 时 ， 必 须 使 用 该 名 字 。 

Box D 表 明 ASP 能 够 处 理 条 件 逻 辑 。 在 本 例 中 ， 如 果 客 户 选 中 某 种 商品 ， 则 将 其 提交 至 购物 
车 以 便于 跟踪 ， 直 至 购物 完成 。Box E 展 示 ASP 如 何 与 数据 库 连接 并 发 送 查询 。 在 本 例 中 ， 查 询 
将 会 选择 家 具 成 品 ， 并 形成 某 一 系列 的 产品 。Box F 说 明 在 客户 机 上 显示 Box E 的 查询 结果 所 必 
须 的 HTML 和 ASP 的 组 合 。Box G 关 闭 变 量 rsRes， 它 用 来 遍历 形成 某 个 产品 系列 的 所 有 成 品 。 

这 个 简单 的 ASP 编 码 示例 说 明 ， 任何 一 个 有 HTML 和 VBScript/JavaScript 经 验 的 人 都 能 很 快 
地 用 ASP 建 立 一 个 动态 Web 站 点 。 而 那些 对 VBScript/JavaScript 不 太 熟 悉 的 人 可 能 会 发 现 


ColdFusion 更 容易 理解 和 快速 使 用 。 本 书 建议 读者 安装 这 两 种 购物 车 的 版 本 ， 以 便 在 自己 的 机 
器 上 比较 它们 的 优 劣 。 
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10.5.2 ColdFusion 示例 

ColdFusion 要 求 使 用 服务 器 端 标 记 语 言 一 一 ColdFusion 标 记 语 言 (ColdFusion Markup 
Language，CFML) 产生 ColdFusion 应 用 页 面 脚本 ， 这 种 脚本 的 扩展 名 为 .cftm。 当 客户 机 浏览 
器 向 Web 服 务 器 发 送 一 个 .cftm 页 面 请 求 时 ， 该 请 求 会 被 传递 到 ColdFusion 应 用 服务 器 ， 在 那里 
执行 脚本 ， 执 行 的 结果 会 转化 为 HTML 格 式 并 返回 Web 服 务 器 ，Web 服 务 器 进一步 将 结果 返回 
客户 机 并 进行 显示 。 

CFML 以 HTMEL 为 模板 构成 ， 它 包含 读 和 更 新 数据 库 表 的 标记 ， 可 以 产生 并 检索 电子 邮件 
消息 ， 并 且 能 执行 HTTP 和 FTP 操 作 ， 进 行 信用 卡 核实 和 身份 验证 、 读 写 客 户 端 cookie 等 操作 。 
借助 于 这 些 功 能 就 可 以 实现 动态 页 面 的 创建 、 用 真实 数据 填充 表单 、 处 理 表单 提交 的 能 力 以 及 
与 本 地 文件 的 交互 。 

简单 的 ColdFusion 购 物 车 包含 7 个 .cftm 文 件 : 

。 application cfm 一 一 该 文件 设置 应 用 程序 、 客户 机 和 会 话 范围 变量 的 状态 以 及 激活 时 间 的 

长 短 。 这 个 文件 自动 由 ColdFusion 服 务 器 包括 在 每 个 页 面 的 顶端 。 
显示 购物 车 内 容 ， 人 允许 增加 或 减少 购物 车 中 的 项 目 。 
接收 购物 者 信息 并 完成 订单 ， 但 尚 不 具有 存储 订单 和 处 理 信 用 卡 的 功能 。 





s。 cart.cfm 





。 checkout.cfm 





"item cfm 一 一 显示 有 关 某 项 目 〈 某 件 家 具 ) 的 信息 ， 并 提供 链接 到 搜索 框 和 主 区 域 的 选项 。 
“line cfm 一 一 显示 在 某 次 购物 完成 时 得 到 的 所 有 产品 的 列表 ， 人 允许 访问 搜索 框 。 








。Search.cfm 显示 与 搜索 参数 Product_t.Product_Description 匹 配 的 所 有 产品 的 列表 ， 搜 

索 参 数 由 表格 中 的 字段 serarchval 决 定 。 

“store.cfm 一 一 松 谷 家 具 公 司 ColdFusion 购 物 车 演示 程序 的 主页 。 可 以 使 用 搜索 工具 查找 特 

定 项 目 ， 并 且 列 出 所 有 不 同 的 、 可 以 购买 的 成 品系 列 。 

图 10-6 显 示 了 完整 的 application.cfm 文 件 。 其 中 ，<CFAPPLICATION> 标 记 指 定 应 用 名 称 为 
PVFC。 客 户 机 与 会 话 管理 都 设置 为 “TRUE”。 激 活 客 户 机 与 会 话 管理 使 得 Web 应 用 能 够 对 每 
个 客户 机 保持 一 种 虚拟 状态 ， 这 对 于 记 住 每 个 客户 购物 车 中 的 内 容 非 常 必 要 。 无 论 是 否 使 用 
cookie， 这 些 选 项 可 以 保证 会 话 之 间 彼 此 区 分 并 且 保证 安全 ， 而 且 虚 拟 地 使 用 所 有 浏览 器 。 

将 要 被 访问 的 数据 库 也 在 此 处 命名 ， 在 机 器 上 安装 购物 车 演示 程序 时 将 会 用 到 该 数据 库 。 
本 例 中 ，ODBC 数 据 源 被 命名 为 “PVFMDB”。<CFIF> 标 记 表 示 条 件 逻 辑 。 本 例 中 ， 如 果 没 有 
定义 session.cart， 客 户 机 就 开始 一 个 新 的 会 话 ， 此 时 应 该 定义 session.cart， 如 果 已 经 定义 了 
session.cart， 就 不 采取 任何 行动 。 这 里 ， 可 以 为 应 用 范围 变量 和 对 话 范围 变量 设置 一 个 容许 的 
时 间 间 隔 ， 以 便 能 自动 删除 被 放弃 的 购物 车 (图 10-6 所 示 的 简单 代码 中 没有 提 及 )。 








<!I---Name application——-> 

<CFAPPLICATION NAME="PVFC" CLIENTMANAGEMENT="TRUE" SESSIONMANAGEMENT=r"TRUE> . 
<!I---Set application constants——-> 

<CFSET ODBC_DataSource =“PVFMDB"> 

<CFSET BG_Color = "ffffcc”> 


<CFSET Text = “00008b"> 

<I-~--Set application variables———> 

<CFIF not isDefined(“Session.cart")> 
<CFSET Session.cart=ArrayNew(2)> 

</CFIF> 





图 10-6 application.cfm 


另外 一 个 文件 item.cfm 如 图 10-7 所 示 。 图 中 所 使 用 每 个 CFML 标 记 都 用 黑体 加 粗 并 且 用 方 
框 括 了 起 来 。 因 此 ， 我 们 很 容易 看 出 CFML 标 记 在 概念 上 与 HTML 标 记 的 相似 之 处 。 每 遇 到 一 
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个 CFML 标 记 ，Web 服 务 器 就 会 与 ColdFusion 服 务 器 联系 ， 以 获得 对 该 标记 的 解释 。 在 这 里 ， 
我 们 将 逐个 介绍 5 对 CFML 标 记 ， 以 帮助 读者 初步 理解 CFML 标 记 的 本 质 。ColdFusion 购 物 车 示 
例 所 包含 的 其 他 5 个 文件 也 需要 一 一 研究 ， 但 这 里 就 不 再 更 述 。 

在 图 10-7 中 ，Box A 包含 几 个 CFML 标 记 。 首 先 ，<CFPARAM> 设 定 所 需要 的 参数 或 参数 默 
认 值 。 这 里 ，irem 参 数 的 软 认 值 设 为 “”“。 下 -- 个 CFML 标 记 <CFIF> 设 置 一 个 条 件 膛 辑 循环 ， 
Citem 是 否 取 <CFPARAM> 中 设置 的 默认 值 之 外 的 值 作为 判断 条 件 。 当 irem 的 值 不 是 默认 值 “” 
上 时， 那么 就 显示 一 种 产品 ， 并 使 用 CFML 标 记 <CFSET> 将 其 存 人 变量 strirrem 中 ，<CFSET> 的 
作用 是 给 变量 赋值 。 

<CFIF> 是 建立 条 件 逻 辑 的 一 组 标记 中 的 一 个 ， 并 且 也 是 最 常用 的 一 个 。 每 个 <CFIF> 标 记 
必须 有 与 其 相 匹 配 的 </CFIF> 标 记 。 用 于 比较 的 标记 还 有 <CFELSEIF> 和 <CFELSE>。 人 在 一 个 
<CFIF> 循 环 中 ， 根 据 需 要 可 以 使 用 多 个 <CFELSEIF> 标 记 ， 但 是 只 能 使 用 一 个 <CFELSE> 标 记 。 
Box C 包 含 另 外 一 个 条 件 逻 辑 的 例子 ， 该 条 件 逻 辑 把 所 需要 项 目的 信息 移 人 购物 车 (carrcjr )。 

Box A 中 还 有 一 个 标记 <CFLOCATION>， 它 用 来 把 浏览 器 重 定 向 到 一 个 不 同 的 URL。 本 例 
中 ， 浏 览 器 被 重 定 向 到 应 用 程序 的 主页 。 

Box B 包 含 控制 显示 的 CFML 标 记 <CFOUTPUT>，BODY 语 句 就 放置 在 CFOUTPUT 代 码 块 
中 。 因 此 ， 每 个 被 声明 的 变量 值 (“#” 包 围 的 值 ) 都 将 会 被 使 用 。 而 在 application.cfin 文 件 中 ， 
这 些 变量 的 值 都 被 设置 为 应 用 程序 的 常数 。 

Box D 显 示 了 <CFQUERY> 的 用 法 ， 它 与 数据 座 连 接 并 选择 所 需要 的 某 个 项 目的 信息 。 需 
要 注意 的 是 ， 代 码 中 指定 的 数据 源 是 在 application.cfim 中 确定 的 ， 而 item 的 值 则 是 在 search.cfm 
中 确定 的 。 这 个 代码 块 中 包括 SQL 查 询 ， 结 果 返 回 需 要 显示 的 产品 信息 。 由 search.cfm 返 回 的 
item 值 赋 给 变量 strltem。 查 询 输出 作为 Box E 代 码 模块 的 结果 显示 出 来 。 名 为 lftem 的 查询 的 结果 
由 <CFOUTPUT> 标 记 格 式 化 ， 模 块 中 使 用 HTML 代 码 来 格式 化 查询 的 输出 。 

上 述 关 于 ColdFusion 编 码 的 简短 介绍 表明 : CFML 标 记 与 HTML 标 记 非 常 相似 ， 将 它们 结 
合 可 以 很 容易 创建 与 数据 库 连接 的 动态 Web 应 用 程序 。 自 前 有 将 近 100 个 CFML 标 记 可 支持 传统 
的 编程 结构 和 技术 。 不 过 ，CFML 不 需要 像 传统 编程 语言 那样 编码 ， 只 需 理解 HTML 就 可 以 了 。 
编写 基于 Web 的 定制 应 用 程序 有 一 些 非常 简便 而 快速 的 工具 ，ColdFusion 就 是 其 中 之 一 。 

从 前 面 两 部 分 的 介绍 中 ,还 同时 展现 了 在 其 他 语言 中 散 入 使 用 SQL 代码 的 例子 。 参 见 图 
10-5 的 Box E 和 图 10-7 的 Box D ， 我 们 可 以 发 现在 与 数据 库 连接 的 ASP Web 应 用 程序 中 代入 
VBScript 的 SQL 语句 ， 以 及 在 与 数据 库 连 接 的 Coldfusion Web 应 用 程序 的 CFML 标 记 中 人 息 入 的 
SQL 语句 。 在 这 两 个 例子 里 ，SQL 代 码 或 者 通过 ASP 服 务 器 或 者 通过 ColdFusion 服 务 器 传送 到 
数据 库 ， 在 那里 解释 执行 SQL 语句 并 返回 结果 。 然 而 ， 这 种 “嵌入 式 SQL” 模 式 并 不 需要 使 用 
与 第 三 代 语 言 (Third Generation Language, 3GL， 如 C 语 言 ) 中 人 嵌入 式 SQL 类 似 的 复杂 语法 。 
更 完整 的 在 3GL 中 使 用 嵌入 式 SQL 的 内 容 请 参见 下 节 。 

1 一 一 一 

Deea by: Michael Alexander 


Project: Pine Valley Furniture Demo, ASP 
Purpose: Display a specific Product. 


This page displays a specific item in its main area. 
lt also provides an option to link to the search box and the main area. 


Check to see if the user has gotten to this page correctly. 
---> 











图 10-7 item.cfm 





<CFPARAM NAME="item" DEFAULT=""> 

<CFIF item IS NOT "> 

<!--- We do have a Product, so put it into strltem.———> 
<CFSET #strltem# = #item#> 

<CFELSE> 

<!--~We don't have a Product, so kick back out to main store page.~--> 
<CFLOCATION url="store.cfm" addtoken="NO"> 

</CFIF> 


<HTML> 

<HEAD> 

<META NAME="GENERATOR" Content="Microsoft Visual Studio 6.0"> 
<TITLE>Pine Valley Furniture Company Web Store/TITLE> 

<HEAD> 


<CFOUTPUT> 
<BODY bgcolor=#BG_Color# text=#Text# link=#Text# vlink 一 #Text# alink=#Text# > 
</CFOUTPUT> 


<TABLE align=center> 
”<TR> 
<TD><STRONG><FONT size=6>Pine Valley Furniture Store 
</FONT></STRONG></TD> 


<TR align=right> 
<TD valign=top align=center> 
<B>Search for a product such as bookcase, nightstand, or table:</B><BR> 


<FORM action="search.cftm" method=post> 
<INPUT Name="searchval” type=text width=20><BR><BR> 
. <INPUT Value="SEARCH!” type=submit><BR> 
</FORM>> 
<BR> 
<A href—"store.cfm">Return to Store Front</A><BR> 


<CFIF not ArraylsEmpty(Session.cart)> 
<FORM method=post action=cart.cfm> 
<INPUT type=Hidden name=Quantity value=0> 
<INPUT type=Hidden name=item value=0> 
<INPUT type=Hidden name=none value=0> 
<INPUT type=Submit value="Go to Cart"> 
</FORM><BR> 
</CFIF> 


<TD> 
<TD valign=top width=75%> 
<TABLE align=center> 
<!-——-REM Get the information about the Product———> 





图 10-7 ( 续 ) 
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<CFQUERY DATASOURCE=#ODBC_DataSource# Name="ltem"> 
SELECT * 

FROM PRODUCT +t 

WHERE Product_ID = #stritem# 

</CFQUERY> 


<CFOUTPUT query="ltem"> 
<tr> 


<td>Product: </td> 

<td width=75% align=ieft>#Product_Description#<J/td> 
<Vtr> 
<tr> 

<td>Finish: </td> 

<td width=75% align=left>#Product_Finish#</td> 


<td>Cost: </td> 
<td width=75% 
align=ieft>#DecimalFormat (Standard_Price) #</td> 


<FORM method=-post action="”cart.cfm”> 
<INPUT type=Hidden Name=ltem Value=#Product_ld#> 
<td colspan=2 align=center> 

<INPUT type=Submit Value 一 "Buy It!"> 





</td> 
</FORM> 


<FORM method=post action="line.cfm"> 
<INPUT type=Hidden Name=line 
Value="#Product._Finish#"> 
<td colspan=2 align=center> 
<INPUT type=Submit Value="Go to 
#Product_Finish# Finish"> 
</td> 
<FORM> 
<tr> 
</CFOUTPUT> 





图 10-7 ( 续 ) 
10.5.3 铸 入 式 SQL 
我 们 在 第 7 章 和 第 8 章 介绍 了 交互 和 直接 的 SQL 形式 。 在 前 述 例子 中 ， 输入 一 条 SQL 命令 并 
一 次 执行 ， 即 SQL 命令 构成 作业 或 事务 的 一 个 逻辑 单元 。 一 些 维护 数据 库 有 效 性 所 必须 的 命令 
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(如 ROLLBACK 和 COMMIT) 在 大 多 数 交互 式 SQL 状 态 下 对 于 用 户 而 言 是 透明 的 。 而 另 一 种 在 
创建 客户 端 和 服务 器 端 应 用 程序 时 广泛 使 用 的 SQL 形式 称 为 蔡 入 式 SQL。 在 3GL 中 嵌入 SQL 束 
是 把 SQL 命令 放 在 3GL 宿 主 程序 中 的 合适 位 置 。 所 谓 3GL 是 指 第 三 代 语 言 ， 如 ADA、COBOL、 
C、Fortran 、M、Pascal、PL/I 等 。Oracle 提 供 PL/SQL ， 即 过 程 化 语言 SQL (Procedural 
Language SQL)， 它 是 一 种 扩展 后 的 SQL 的 专用 语言 ， 其 中 添加 了 一 些 过 程 化 语言 的 特性 ， 如 
变量 、 类 型 、 控 制 结 构 (包括 IF-THEN-ELSE 循 环 )、 函 数 和 过 程 等 。PL/SQL 代 码 块 也 可 以 从 
入 3GL 程 序 。 

我 们 考虑 在 3GL 中 嵌入 SQL 有 以 下 几 个 原因 。 首 先是 为 了 创建 一 种 更 灵活 的 、 易 访问 的 用 
户 界面 。 有 效 使 用 交互 式 SQL 要 求 用 户 对 SQL 本 身 、 数 据 库 结构 有 较 好 的 理解 ， 而 用 户 通 常 都 
不 具备 这 种 能 力 。 许 多 RDBMS 都 包含 表单 、 报 表 和 应 用 生成 程序 (或 者 由 附加 软件 提供 )， 但 
使 用 这 些 a er 使 用 3GL 会 比较 容易 达到 他 们 的 期 望 ， 因 为 
3GL 具 有 对 SQL 数据 库 进 行 菊 入 式 SQL 调 用 的 能 力 ， 所 以 能 更 好 地 编写 那些 需要 访问 关系 数据 

库 的 大 型 复杂 程序 。 

其 二 是 为 了 通过 使 用 嵌入 式 SQL 改 善 性 能 。 交 互 式 SQL 在 每 次 处 理 查 询 时 都 需要 将 其 转换 
为 可 执行 的 机 器 代码 ， 但 直接 式 SQL 所 自动 运行 的 查询 优化 器 可 能 并 没有 成 功 地 优化 查询 ， 因 
而 导致 执行 速度 缓慢 。 有 了 艇 入 式 SQL， 开 发 人 员 可 以 更 好 地 控制 数据 库 访问 ， 因 此 极 大 地 改 
善 性 能 。 何 时 依赖 SQL 转换 器 和 优化 器 、 何 时 通过 程序 控制 取决 于 问题 的 性 质 ， 并 且 必 须 借 助 
经 验 和 测试 来 确定 最 终 的 解决 方案 。 

使 用 在 入 式 SQL 的 第 三 个 原因 是 提高 数据 库 的 安全 性 。DBA 通 过 使 用 SQL 提 供 的 GRANT 
和 REVOKE 命 令 以 及 创建 视图 对 访问 进行 限制 。 相 同 的 限 
制 在 嵌入 式 SQL 应 用 程序 中 也 可 以 调用 ， 从 而 提供 了 另外 汇 入 SQL 命令 的 宿主 程序 
一 层 保护 。 此 外 ， 在 嵌入 式 SQL 中 ,更 容易 完成 复杂 的 数 
据 完整 性 检查 ， 包 括 交叉 字段 一 致 性 检查 。 

使 用 艇 入 式 SQL 的 程序 包含 由 C 或 COBOL 等 3GL 编 写 
的 宿主 程序 ， 以 及 贯穿 其 中 的 SQL 代码 。 每 个 SQL 代码 块 
都 以 关键 词 EXEC SQL 开始 ， 在 程序 预 编 译 时 ， 该 关键 词 
表明 仍 入 式 SQL 命 令 将 被 转换 为 宿主 源 代 码 。 不 同 的 宿主 
语言 需要 不 同 的 预 编 译 器 ， 而 且 必 须 确 保 3GL 编 译 器 与 
RDBMS 用 于 每 种 语言 的 预 编 译 器 兼容 。 和 代入 式 SQL 程 序 的 


处 理 步 又 如 图 10-8 所 示 。 

预 编译 器 碰 到 EXEC SQL 语句 时 ， 就 把 SQL 命令 翻译 成 
宿主 程序 语言 。 有 些 预 编译 器 会 检查 SQL 语 法 的 正确 性 并 
产生 错误 消息 直到 SQL 语 句 试 图 实际 执行 为 止 。 某 些 产 品 
的 预 编译 器 (DB2、SQL/DS、Ingres ) 会 为 SQL 语句 创建 


-个 单独 文件 ， 然 后 由 一 个 称 为 联 编程 序 的 单独 应 用 程序 i 
对 它 进行 处 理 ， 这 个 联 编程 序 确定 引用 对 象 是 否 存 在 、 用 | 2 ] 


户 是 否 拥有 运行 SQL 语句 的 权限 以 及 将 要 使 用 的 处 理 方法 
二 其 他 一 些 产 品 (Oracle、Informix ) 则 是 在 运行 时 解释 和 
SQL 语句 ， 而 并 不 编译 它们 。 这 两 种 情况 下 ， 最 后 所 得 到 的 程序 都 包含 对 DMS 例 程 的 调用 ， 链 
接 吕 /编辑 器 会 把 它们 链接 进来 。 

下 面 的 程序 是 一 个 如 何在 程序 中 嵌入 SQL 的 简单 示例 ， 该 程序 使 用 C 语 言 作为 宿主 语言 。 
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本 例 中 包含 一 个 准备 好 的 SQL 语句 ， 叫 做 “getcust" ， 它 将 被 编译 和 存储 为 数据 库 的 可 执行 代 
码 。Cust_ID 是 顾客 表 的 主键 。 该 5QL 语 句 返 回 和 某 个 订单 号 相 匹配 的 顾客 信息 (c_name、 
c_address、city、state 、postcode )。SQL 语 句 里 的 订单 信息 使 用 一 个 占 位 符 表 示 ， 意 为 输入 参 
数 。 顾 客 信息 是 SQL 查询 的 输出 并 且 通 过 into 子 句 存 入 宿主 程序 的 变量 中 。 本 例假 定 查询 仅 返 
加 一 行 结果 。 如 果 要 返回 多 行 结 果 ， 必 须 采 用 游标 写 一 个 循环 程序 ， 使 得 每 次 返回 一 个 元 组 并 
保存 起 来 。 游 标 帮助 消除 SQL 的 一 次 设 定 处 理 与 过 程 语言 的 一 次 记录 处 理 之 间 的 阻抗 失 配 。 
exec sql prepare getcust from 
"select c name, c address, city, state, postcode 


from customer t+, order t 
where customer t.cust id=order t.cust id and order id=?"; 


./* code to get proper value in theorder */ 
exec sql execute getcust into :c name, :c address, :city, :state, 
:postcode using theOrder; 


10.6 管理 Web 数 据 


数据 库 对 于 因特网 的 重要 性 不 言 而 喻 。 随 着 数据 库 对 于 因特网 应 用 程序 而 言 越 来 越 重 要 ， 
- 些 传统 的 数据 库 问题 也 日 益 重 要 起 来 。 首 先 就 是 数据 库 的 安全 性 问题 ，Web 应 用 程序 与 公司 
外 部 的 用 户 建立 连接 并 可 供 该 用 户 访问 ， 这 种 方式 其 至 在 几 年 前 都 未 曾 听 说 过 。 其 次 是 隐私 问 
题 ， 公 司 可 以 收集 那些 访问 他 们 Web 站 点 的 访问 者 的 相关 信息 。 如 果 他 们 从 事 的 是 电子 商务 活 
动 ， 在 Web 上 出 售 产品 ， 那 么 他 们 可 以 收集 对 其 业务 有 价值 的 顾客 信息 。 如 果 公 司 在 顾客 不 知 
情 的 前 提 下 泄露 顾客 信息 ， 或 者 顾客 认为 可 能 发 生 了 类 似 情况 ， 都 将 会 引起 关于 道德 和 隐私 权 
的 争论 。 最 后 是 关于 因特网 技术 更 新 速度 的 问题 。 技 术 变化 的 步伐 在 不 断 加 快 ， 数 据 库 管理 员 
也 面临 着 巨大 挑战 : 他 们 必须 频繁 更 新 现 有 产品 , 并 评估 和 确定 新 产品 对 于 业务 运作 的 重要 性 。 
以 下 将 分 别 讨 论 这 些 问题 。 
10.6.1 Web 安 全 性 问题 

用 户 对 网 上 交易 的 安全 性 缺乏 信任 是 抑制 电子 商务 发 展 的 最 重要 的 因素 之 一 。 必 须 解 决 与 
Web 相 关 的 数据 库 安全 性 问题 ， 以 保护 敏感 信息 ， 控 制 泄露 数据 的 风险 。 将 商业 应 用 程序 与 公 
众 网 络 (如 因特网 ) 链接 起 来 时 要 求 必 须 妥善 处 理 所 有 已 经 出 现 的 安全 隐患 。 在 处 理 一 个 需要 
返回 数据 库 信息 并 加 以 显示 的 客户 端 请 求 时 ， 必 须 严格 限制 所 能 得 到 的 信息 。 通 过 因特网 连接 
发 送 请 求 的 客户 端 不 可 以 直接 访问 数据 库 。 

整个 系统 都 必须 在 网 络 级 、 操 作 系统 级 、Web 服 务 器 级 以 及 数据 库 级 等 各 个 级 别 采 取 安 全 
性 措施 。 在 各 个 区 域 都 应 该 保持 警惕 ， 如 果 要 访问 敏感 数据 则 必须 通过 所 有 的 安全 性 检查 。 同 
时 ， 由 于 业务 /安全 环境 的 频繁 改变 可 能 会 使 得 先前 安全 的 站 点 也 受到 非法 入侵 的 攻击 ， 所 以 
定期 监控 以 及 进行 安全 测试 也 必 不 可 少 。 图 10-9 展 示 硬件 的 安全 措施 ， 它 可 以 放 在 除了 防火 墙 
以 外 的 任何 位 置 ， 作 为 抵御 非法 入 侵 的 第 一 道 防线 。 

图 10-9 中 除了 包含 先前 讨论 过 的 防火 墙 以 及 图 10-1 所 述 的 安全 措施 之 外 ， 还 添加 了 路 由 器 
(router) 符号 与 非法 入 盆 检 测 系统 ( Intrusion Detection System, IDS) 符号 。 路 由 器 是 放置 在 
通信 网 络 中 的 中 间 设 备 ， 用 来 传输 消息 包 ， 并 以 最 有 效 的 路 径 将 消息 包 转 发 到 正确 的 目的 地 。 
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而 非法 入 侵 检测 系统 则 试图 识别 非法 进入 计算 机 系统 或 误 用 计算 机 系统 的 企图 。IDS 可 以 监控 
网 络 上 传输 的 消息 包 ， 监 控 系 统 文件 、 日 志文 件 ， 还 可 以 设置 欺骗 系统 ， 通 过 众所周知 的 安全 
泥 洞 尝试 诱捕 黑客 。 除 此 之 外 ， 还 应 注意 在 图 10-9 中 ，Web 服 务 器 与 业务 或 内 部 主机 是 相互 隔 
离 的 ， 同 样 ， 数 据 库 服 务 器 与 Web 服 务 器 之 间 也 应 该 相互 隔离 。 





Web 服 务 群 





撕 法 入 侵 从 测 系统 


业务 系统 


图 10-9 建立 因特网 安全 措施 

1. Web 安 全 计划 

通过 执行 一 个 正式 的 、 书 面 的 、 被 管理 人 员 所 认可 的 风险 评估 ， 为 启用 Web 的 数据 库 应 用 
程序 建立 安全 机 制 。 风 险 评 估 至 少 应 考虑 以 下 因素 

。 风 险 的 本 质 。 

。 风 险 的 可 能 性 。 

“对 组 织 在 运作 、 财 务 及 法 律 上 潜在 的 影响 。 

“存在 某 些 人 有 可 能 破坏 安全 措施 的 情况 。 

在 没有 从 其 他 相关 人 员 那 里 获得 信息 的 前 提 下 ， 数 据 库 管理 员 自己 不 应 进行 风险 评估 。 风 
险 评估 应 委派 给 那些 有 能 力 成 功 完成 它 的 人 去 进行 ， 而 且 他 们 还 能 够 将 风险 评估 的 内 容 传 达 给 
相应 的 管理 层 。 这 样 做 的 结果 是 由 管理 层 而 不 是 由 数据 库 管理 员 负 责 处 理 风 险 ， 从 而 可 以 起 到 
保护 数据 库 管理 员 的 作用 。 

2. 网 络 级 安全 

充分 保护 因特网 环境 里 的 数据 库 还 需要 保护 与 之 通信 的 网 络 。 

“如果 必 须 与 内 部 系统 相连 ， 则 Web 服 务 器 和 数据 库 服务 器 应 处 在 与 其 他 业务 系统 不 同 的 

局 域 网 中 ， 而 且 它 们 之 间 应 该 设置 防火 墙 。 防火墙 设置 在 Web 服 务 器 和 数据 库 服 务 器 之 

间 以 及 它们 与 业务 系统 之 间 ， 防 火 墙 仅 仅 行使 防火 墙 的 功能 ， 并 且 受 口令 保护 。 

"应 尽量 减少 连 网 服务 器 中 硬盘 的 共享 。 

“应 记录 网 络 和 防火 墙 日 志 ， 使 任何 改动 都 不 易 发 生 ; 并 且 要 对 它们 进行 定期 监控 ， 以 发 
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现任 何 未 经 授权 或 不 寻常 的 举动 。 

* 安装 并 定期 监控 用 于 检测 来 自 外 部 的 探查 和 攻击 的 软件 。 热 行 该 监控 任务 的 人 员 应 定期 

访问 软件 厂商 的 站 点 和 安全 性 Web 站 点 ， 以 便 发 现 新 的 安全 性 漏洞 并 尽快 修补 。 

3. 操作 系统 级 安全 

正如 为 了 保护 数据 库 和 内 部 业务 系统 而 建立 网 络 级 安全 一 样 ， 还 必须 建立 充分 的 操作 系统 
级 安全 。 

。 通 过 及 时 访问 软件 厂商 的 站 点 和 安全 性 Web 站 点 ， 对 新 发 现 的 漏洞 应 用 补丁 ， 从 而 修补 

所 有 已 知 操作 系统 的 漏洞 。 

* 安装 反 病毒 软件 ， 在 机 器 启动 、 下 载 文件 或 接收 电子 邮件 时 ， 自 动 检查 病毒 。 

* 监控 服务 器 日 志 ， 同 监控 网 络 日 志 一 样 对 对 未 经 授权 的 活动 进行 监测 。 安 装 和 监控 IDS 

软件 ， 以 检测 外 部 的 探查 和 攻击 。 

“在 因特网 环境 里 ， 禁 止 任何 不 必要 但 可 能 会 向 未 经 授权 的 用 户 提供 访问 的 服务 。 例 如 ， 

发 送 邮 件 服务 ， 虽 然 它 已 被 新 的 电子 邮件 程序 取代 ， 但 仍然 嵌入 在 操作 系统 中 ， 因 此 应 

该 被 禁止 。 

4. Web 服 务 器 安全 

每 个 Web 服 务 器 都 应 进行 良好 的 配置 以 使 非法 访问 难以 进行 ， 最 好 是 不 发 生 非法 访问 。 不 
过 ， 层 出 不 穷 的 新 病毒 和 黑客 使 大 家 认识 到 要 想 达到 完全 的 系统 安全 是 不 可 能 的 。 因 此 ， 要 注 
意 设置 Web 服 务 器 以 尽 可 能 地 限制 访问 。 


“ 尽 可 能 地 限制 Web 服 务 器 上 用 户 的 数量 ， 以 及 超级 用 户 或 管理 员 的 数量 。 只 有 授权 用 户 


才能 安装 软件 、 编 辑 或 添加 文件 。 

“限制 对 Web 服 务 器 的 访问 ， 尽 量 减少 开放 的 端口 。 使 打开 的 端口 数量 最 少 ， 最 好 只 开放 

http 和 https 。 

* 印 载 任何 在 安装 服务 器 时 自动 安装 但 并 不 需要 的 程序 。 比 如 演示 程序 就 可 能 向 黑客 提供 

他 想 要 的 访问 。 编 译 器 与 解释 器 (如 Perl) 不 要 放 在 可 从 因特网 直接 访问 的 路 径 上 。CGI 

有 潜在 的 安全 性 问题 ， 所 以 最 好 在 必要 时 再 运行 它 ， 并 且 应 把 所 有 的 CGI 脚本 限制 在 一 

个 子 目录 当中 。 

“如 果 Web 服 务 器 运行 在 UNIX 之 上 上 ， 则 必须 确保 不 使 用 root 安 装 默认 的 操作 系统 ， 而 是 从 

仅 有 最 小 权限 运行 Web 服 务 器 软件 的 用 户 账号 下 安装 。 

数据 库 级 安全 将 会 在 第 12 章 中 详细 讨论 。 

10.6.2 隐私 问题 

使 用 因特网 时 保护 个 人 隐私 已 经 成 为 一 个 重要 问题 。 电 子 邮 件 、 电 子 商务 与 营销 ， 以 及 其 
他 在 线 资源 都 可 以 产生 新 的 以 计算 机 作为 媒介 的 交流 方式 ， 而 新 的 与 个 人 隐私 相 冲 突 的 问题 也 
随 之 产生 了 。 许 多 组 织 都 对 人 们 的 因特网 行为 感 兴趣 ， 包 括 雇 主 、 政 府 机 关 以 及 企业 。 返 回 个 
性 化 回答 的 应 用 程序 需要 收集 个 人 信息 ， 但 同时 必须 尊重 员工 、 市 民 以 及 顾客 的 隐私 和 尊严 。 
这 是 一 个 简单 但 难以 操作 的 概念 。 

用 户 必须 保护 自己 的 隐私 权 , 因此 需要 了 解 所 使 用 工具 会 对 个 人 隐私 造成 何 种 影响 。 例如 ， 
在 使 用 浏览 器 时 ， 用 户 可 以 选择 接受 或 者 拒绝 在 他 们 的 机 器 中 放置 cookie。 为 了 作出 符合 自己 
意志 的 选择 ， 用 户 必 须 了 解 几 件 事情 。 首 先 ， 他 们 必须 知道 cookie， 理 解 它 们 的 概念 ， 从 而 能 
够 判断 自己 是 否 接收 定制 化 信息 ， 并 学 会 如 何 设置 机 器 来 接受 或 拒绝 cookie。 浏 览 器 和 Web 站 
点 还 不 具备 帮助 用 户 快速 理解 上 述 知识 的 能 力 。 随 着 利用 Web 进 行 交 流 、 购 物 以 及 其 他 应 用 的 
发 展 ， 隐 私 的 滥用 (比如 出 售 由 cookie 收 集 得 来 的 客户 信息 ) 促使 我 们 开始 深刻 认识 隐私 问题 





的 重要 性 。 

在 工作 中 ， 用 户 必 须 认 识 到 通过 雇主 的 机 器 和 网 络 所 进行 的 通信 并 不 是 保密 的 。 法 院 支 持 
典 主 有 权 监 控 所 有 职员 的 电子 通信 ，。 

因特网 本 身 并 不 保证 通信 和 隐私。 常用 软件 中 所 采用 的 产品 加 密 、 邮 件 匿 名 发 送 、 内 置 安全 
机 制 等 措施 有 助 于 保护 隐私 。 目 前 ， 保 护 私 人 拥有 和 运行 的 计算 机 网 络 已 成 为 信息 基础 设施 的 
一 个 非常 关键 的 部 分 ， 它 对 于 发 展 Web 上 的 电子 交易 、 银 行 、 医 疗 和 传输 应 用 有 重要 的 意义 。 

W3C 提 出 一 个 数据 隐私 标准 (Platform for Privacy Preferences, P3P)， 它 传达 Web 站 点 所 规 
定 的 隐私 政策 并 将 其 与 用 户 自身 的 政策 偏好 作 比 较 。 具 体 地 说 ，P3P 在 Web 站 点 服务 器 上 采用 的 
XML 编 码 可 以 被 任何 配备 P3P 的 浏览 器 或 插件 自动 取 走 。 然 后 ， 客 户 浏 览 器 或 插件 比较 站 点 的 
隐私 政策 和 用 户 的 隐私 偏好 ， 并 把 差异 或 矛盾 告知 用 户 。P3P 主 要 处 理 如 下 几 方 面 的 在 线 隐私 : 

“。 谁 在 收集 数据 ? 

“收集 哪些 信息 ， 为 了 何 种 目的 而 收集 这 些 信息 ? 

“哪些 信息 可 以 与 他 人 共享 ， 共 享 信息 的 人 是 谁 ? 

“用 户 可 以 更 改 收集 者 使 用 他 们 数据 的 方式 吗 ? 

* 如何 解决 争端 ? 

“保留 数据 应 该 制订 什么 政策 ? 

* 在 哪里 可 以 找到 站 点 详细 政策 ? 

匿名 (anonymity) 是 在 压力 下 出 现 的 因特网 通信 的 另 一 个 重要 方面 。 美 国法 律 保 护 匿 名 
权利 ， 但 还 是 要 求 聊天 室 和 电子 邮件 论坛 显示 用 户 名 ,即便 他 匿名 张贴 消息 。1995 年 ， 欧 洲 议 
会 表示 将 切断 与 任何 缺乏 充分 隐私 保护 国家 之 间 的 数据 交换 ， 从 而 使 美国 也 达成 协议 ， 将 对 欧 
洲 客 户 提 供 同 欧洲 企业 一 样 的 隐私 保护 。 这 可 能 会 促使 美国 国会 建立 比 先前 颁布 的 法 案 更 具 保 
护 性 的 新 法 案 。 

FBI 的 电子 邮件 监控 设备 DCS-1000 (原来 叫做 Carnivore) 安装 在 电子 邮件 服务 器 上 ， 它 
可 以 跟踪 电子 邮件 的 标题 但 并 不 跟踪 电子 邮件 的 内 容 。 大 家 发 现 ，DCS-1000 具 有 安全 黑洞 ， 
会 破坏 公司 的 技术 基础 设施 或 者 危及 隐私 。 美 国 公民 自由 联盟 正 试图 使 美国 国会 注意 ， 现 有 隐 
私法 对 于 因特网 通信 来 说 已 经 过 时 。 尽管 政府 修订 针对 因特网 通信 的 隐私 条 款 的 速度 非常 缓慢 ， 
但 个 人 和 企业 在 建立 所 需 的 隐私 级 别 时 ， 应 确保 自己 理解 当前 的 权利 和 责任 。 
10.6.3 因特网 技术 的 更 新 速度 问题 

从 本 章 可 以 看 到 ， 硬件、 软件 与 电信 技术 的 更 新 在 信息 时 代 发 展 的 道路 上 起 着 重要 作用 .。 
仕 过 去 的 20 年 里 ， 很 少 有 公司 只 实现 一 个 信息 系统 并 长 期 依赖 于 这 个 信息 。 变 化 的 速度 和 广度 
已经 使 许多 公司 难以 招架 。 由 于 设计 周期 缩短 ， 在 这 样 一 种 动态 环境 中 竞争 变 得 非常 具有 挑战 
性 ， 公 司 也 不 得 不 彻底 改造 自身 ， 并 尝试 用 环境 、 经 验 、 和 技能 装备 他 们 的 员工 以 便 在 不 断 变 
换 的 经 济 和 文化 中 使 公司 繁 某 发 展 。 

在 过 去 的 20 年 中 ， 信 息 技术 的 变化 速度 不 断 加 快 。 要 实现 概念 简单 而 视觉 优美 的 、 完 整 而 
分 布 的 系统 是 非常 困难 的 。 要 时 刻 牢 记 “ 细 节 才 是 罪魁 祸 普 ”这 名 俗语。 信息 技术 的 规划 已 经 
从 独立 的 战术 活动 演变 为 组 织 的 策略 规划 的 中 心 。 员 工 和 顾客 对 相关 的 、 易 用 性 系统 的 期 望都 
呈现 极 大 的 上 升 趋势 。 在 市 场 中 ， 有 效 的 IT 系统 已 成 为 成 功 的 关键 因素 。 而 数据 库 技术 是 满足 
这 些 期 望 并 支持 业务 策略 的 最 基本 要 素 。 

在 数据 库 取 代 了 平面 文件 之 后 ， 创 建 一 个 更 为 集成 的 数据 管理 环境 的 工作 就 开始 了 。 关 系 
数据 库 技术 解决 了 在 一 个 位 置 记录 数据 而 在 不 同 的 应 用 程序 中 使 用 这 些 数据 的 问题 。 面 向 对 象 
数据 库 改善 了 响应 时 间 ， 因 为 请 求 对 象 时 不 需要 重新 构造 这 些 对 象 。 
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现在 ， 期 盼 已 入 的 计算 技术 与 电信 技术 的 结合 正在 转变 人 们 获取 及 共享 信息 的 方式 。 传 统 
的 技术 也 不 再 像 以 前 那样 各 行 其 是 。 蜂 窝 电话 和 个 人 数字 助理 (Personal Digital Assistant， 
PDA) 都 可 以 与 因特网 相连 。 人 们 可 以 通过 寻呼机 答复 电子 邮件 ， 即 使 在 开会 时 也 不 受 影响 。 
电视 通过 无 线 电波 、 电 缆 和 卫星 传送 电视 节目 。 这 些 传统 上 相互 独立 的 技术 通过 结合 创造 了 畸 
新 的 商业 机 会 ， 同 时 也 需要 出 台新 的 政策 和 法 规 来 控制 公共 服务 ， 如 无 线 电波 和 公众 网 络 等 。 
随 着 数据 库 访问 的 新 方法 及 其 定位 的 建立 ， 数 据 库 安全 问题 也 开始 涌现 出 来 。 

同时 ， 组 织 的 关系 变化 也 促使 数据 库 管理 员 想 办 法 处 理 新 的 业务 形式 。 合 作 模型 是 竞争 模 
型 的 有 益 补充 。 当 几 个 公司 为 完成 同一 个 项 目 而 协同 工作 、 在 项 目 完成 后 才 分 开 时 ， 访 问 共享 
数据 库 的 问题 也 变 得 日 益 重 要 起 来 。 

商业 的 全 球 化 速度 也 以 前 所 未 有 的 速度 在 加 快 。 各 大 公司 有 策略 地 在 全 球 范围 内 部 署 自己 
的 团队 、 保 证 至 少 有 一 支 团 队 在 工作 。IT 经 理 也 被 赋予 全 球 管理 的 责任 ， 如 管理 距离 较 远 的 组 
约 小 给、 墨尔本 小 组 和 伦敦 小 组 。 此 时 也 不 能 为 数据 库 备 份 和 调整 而 停机 ， 而 是 要 求 能 够 一 直 
访问 数据 库 。 

面 对 不 断 加 快 的 更 新 速度 ， 数 据 库 管理 员 必 须 主动 参与 调整 IT 结 构 使 之 符合 企业 战略 的 活 
动 。 因 此 除了 理解 技术 基础 结构 和 数据 库 体 系 结构 外 ， 数 据 库 管理 员 还 必须 对 商业 有 -一定 了 解 ， 
还 要 培养 自己 的 领导 技能 (包括 交流 与 聆听 技巧 )、 对 上 层 的 影响 能 力 以 及 对 员工 的 管理 能 力 等 。 
成 功 的 IT 经 理 不 再 是 只 有 较 深 枝 术 背景 的 人 ,而且 要 有 把 握 商业 环境 中 的 快速 变化 的 能 力 ， 


本 章 小 结 


本 章 意 在 因明 数据 库 与 因特网 应 用 之 间 的 配合 ， 内 容 包括 各 种 因特网 数据 库 体系 结构 ， 解 
释 了 针对 Web 数 据 库 的 ASP 和 ColdFusion 的 使 用 ， 并 讨论 与 之 相关 的 管理 问题 。Web 环 境 的 车 
下 特征 (包括 浏览 器 界面 的 简洁 性 及 功能 的 相似 性 ) 支持 因特网 与 企业 内 部 网 的 商务 应 用 得 以 
快速 采纳 和 实现 。 浏 览 器 软 硬 件 的 独立 性 也 使 跨 平台 的 信息 共享 变 得 容易 起 来 。 开 发 成 本 与 开 
发 时 间 都 有 所 减少 。 

因特网 环境 包括 与 客户 端 工作 站 相连 的 网 络 、Web 服 务 器 和 数据 库 服 务 器 ， 以 及 它们 遵循 
的 TCP/IP 协 议 。 每 台 与 因特网 连接 的 计算 机 必须 有 各 自 不 同 的 JP 地 址 。 在 简单 的 体系 结构 中 ， 
客户 端 浏 览 器 发 出 的 请 求 通过 网 络 传送 到 Web 服 务 器 。 如 果 该 请 求 需要 从 数据 库 中 获取 数据 ， 
那么 由 Web 服 务 器 构造 一 个 查询 并 将 其 传送 至 数据 库 服务 器 ， 数 据 库 服务 器 处 理 查询 并 返回 结 
打 集 。 通 常 采用 防火 墙 限制 外 部 用 户 对 公司 内 部 数据 的 访问 。 

因特网 体系 结构 的 常用 组 件 有 : 某 种 编程 或 标记 语言 、Web 服 务 器 中 间 件 (服务 器 端 扩展 
和 Web 服 务 器 界面 )、Web 服 务 器 、 客 户 端 扩展 。 为 了 帮助 读者 理解 如 何 将 数据 库 连 接 到 Web 页 
面 ， 本 章 给 出 一 个 简单 的 购物 车 应 用 程序 ， 分 别 采 用 ASP 和 ColdFusion 来 实现 这 些 应 用 。 

某 些 传统 的 数据 库 问题 又 引起 人 们 的 极 大 关注 ， 因 为 数据 库 对 于 因特网 应 用 而 言 变 得 越 来 
越 重要 。 这 些 问题 包括 安全 问题 、 隐 私 问题 、 以 及 处 理 商务 和 技术 两 方面 的 快速 更 新 问题 ， 
必须 在 网 络 层 ， 操 作 系统 野 、Web 服 务 器 层 和 数据 库 层 采取 相应 的 安全 措施 。 用 户 必须 保护 自 
己 的 隐私 权 ， 而 且 需 要 了 解 自己 所 使 用 的 工具 在 隐私 方面 有 哪些 规定 。 匿名 问题 也 仍 需要 加 
以 解决 。 

最 后 ， 信 息 技术 的 变化 的 速度 日 益 加 快 ， 我 们 所 有 人 都 必须 努力 使 技术 的 变化 与 业务 实践 
的 变化 相 匹配 。 

盟 然 在 某 些 方面 数据 库 技术 已 相当 成 熟 ， 但 数据 库 对 于 因特网 和 电子 商务 的 开发 有 极为 重 
要 的 作用 ， 因 为 数据 库 总 使 得 它们 处 于 技术 变化 的 前 沿 。 本 章 仅 介绍 了 Web 数 据 库 的 基本 概念， 
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有 兴趣 的 读者 可 以 找到 更 多 的 资料 以 全 面 了 解 当前 该 领域 的 最 新 动态 。 








本 章 复习 
关键 术语 
ActiveX 电子 业务 代理 服务 器 
浏览 器 电子 商务 逆向 代理 
B2B 可 扩展 标记 语言 (XML) 路 由 器 
B2C 防火 墙 服务 器 端 扩展 
层 登 样式 表 (CSS) 超 文本 标记 语言 (HTML) 软 硬 件 负载 平衡 
ColdFusion 标 记 语 言 (CFML) 非法 入侵 检测 系统 (IDS) 标准 通用 标记 语言 (SGML) 
公共 网 关 接口 (CGI) Java VBScript 
cookie Java servlet 万 维 网 (WWW) 
DCS-1000 (Carnivore) JavaScript 万 维 网 联盟 (W3C) 
域名 服务 器 平衡 插件 XHTML 
复习 问题 
1. 定义 下 列 关键 术语 。 
a. ColdFusion 标 记 语 言 (CFML) b. cookie 
c. DNS 平 衡 d. 电子 业务 
e. 防火 墙 f. 服务 器 端 扩展 
g. W3C 
2. 将 下 列 术 语 和 定义 匹配 起 来 。 
一 浏览 器 a. 用 于 多 Web 服 务 器 的 负载 平衡 方法 
-电子 业务 b. 万 维 网 联盟 
~ 防火墙 c. 限制 对 公司 内 部 数据 访问 的 软件 或 硬件 
URL d. 显示 HTMEL 文 档 的 软件 
W3C e. 在 其 他 应 用 程序 中 执行 并 储存 在 服务 器 上 的 小 程序 
XHTML f 确定 Web 服 务 器 的 IP 地 址 和 通信 协议 的 Web 地 址 
-servlet g. 采用 因特网 技术 的 技术 业务 
一 逆向 代理 h. 扩展 HTML 语 言 使 之 与 XML 兼容 的 脚本 语言 
3. 比较 下 列 术语 。 
a. 电子 商务 ; 电子 业务 b. 因特网 ; 企业 内 部 网 ; 企业 外 部 网 
c.HTML; XML; XHTML d. DNS 平衡 软 硬 件 负 载 平衡 ; 逆向 代理 


e. HTML; SGML 

解释 为 什么 将 数据 库 与 Web 页 面相 连 对 于 促进 电子 业务 非常 重要 。 
建立 因特网 数据 库 连 接 所 必须 的 环境 组 件 有 哪些 ? 

阐述 万 维 网 联盟 的 宗旨 和 业绩 。 

数据 库 中 间 件 (如 ColdFusion 和 ASP) 的 作用 是 什么 ? 

. 比较 和 对 比 Web 服 务 器 界面 的 差异 ， 包括 CGI、API 以 及 Java servlet。 
9. 描述 三 种 平衡 Web 服 务 器 负载 的 方式 。 

10. 解释 什么 叫 cookie， 用 作 因 特 网 术语 时 ， 它 是 如 何 使 用 的 ? 

11. 阐述 如 何 使 用 ASP 或 ColdFusion。 


Sa 


oo0 
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12. 描述 在 网 络 层 、 操 作 系 统 层 和 Web 服 务 器 层 为 确保 Web 数 据 库 安 全 所 应 采取 的 安全 措施 。 
13. 简要 描述 一 下 W3C 所 提出 的 数据 隐私 标准 (P3P )。 


问题 和 练习 
1. 阐述 静态 Web 站 点 与 动态 Web 站 点 之 间 的 区 别 。 动 态 Web 站 点 的 哪些 特征 能 够 更 好 地 支 
持 电子 业务 的 发 展 ? 


2. 本 章 列 举 了 九 种 常见 的 内 部 网 服务 。 请 你 指出 哪些 服务 是 任何 企业 内 部 网 所 必须 的 ， 哪 
些 是 可 选 的 ， 并 说 明理 由 。 

3. 了 地址 的 每 个 组 成 部 分 的 含意 是 什么 ”以 24.24.27.15 为 例 加 以 说 明 。( 注意 : 该 题 的 详 
细 答 案 未 在 本 章 中 介绍 。) 

4. 列举 与 因特网 应 用 程序 开发 有 关 的 语言 ， 并 根据 它们 的 功能 进行 分 类 。( 注意 : 不 一 定 
要 与 本 章 所 采用 的 分 类 方案 相同 。) 

5. 在 学 习 和 而 试 了 本 章 所 提供 的 ASP 和 ColdFusion 购 物 车 案例 后 ， 根 据 自 己 的 安装 和 使 用 
经 验 对 ASP 和 ColdFusion 做 一 个 简单 的 比较 。 在 比较 时 ， 要 考虑 到 自己 已 有 的 编程 背景 。 

6. 当 Web 与 数据 库 相 连 时 ， 为 什么 需要 在 四 个 层次 (网络 、 操 作 系统 、Web 服 务 器 、 数 据 
库 ) 上 采取 安全 措施 ? 

7. 讨论 因特网 上 用 户 匿 名 的 优点 和 缺点 。 
应 用 练习 

1. 以 自己 的 PC 为 例 ， 找 到 已 经 下 载 的 插件 ， 并 说 明 它们 的 用 途 。 这 些 插件 是 否 与 操纵 或 
显示 来 自 数据 库 的 数据 有 关 ? 

2. 找到 cookie 下 载 后 的 存储 位 置 ， 按 目录 组 织 它们 。 如 果 你 决定 删除 某 个 cookie ， 请 描述 
你 的 决定 过 程 。 你 是 不 是 对 自己 机 器 上 的 cookie 数 量 感到 惊讶 ? 

3. 如 果 你 要 在 自己 的 Web 站 点 上 或 者 在 你 的 公司 的 对 外 Web 站 点 上 使 用 ASP 或 ColdFusion ， 
那么 你 应 该 做 些 什么 ? 

4. 假如 你 要 连接 一 个 数据 库 到 Web 站 点 上 ， 请 为 你 的 Web 站 点 做 一 个 风险 评估 。 

5. 如 果 将 数据 库 连接 到 公共 站 点 上 , 根据 你 的 工作 列 出 一 个 进行 风险 评估 所 要 采取 的 措施 。 
如 果 可 能 的 话 ， 实 际 实现 该 风险 评估 。 

6. 根据 个 人 兴趣 ， 使 用 ColdFusion 或 ASP 连 接 一 个 数据 库 到 你 的 个 人 Web 站 点 上 。 首 先进 
行 本 地 测试 ， 然 后 将 其 移 至 公共 站 点 。 

7. 获得 一 份 你 所 处 工作 位 置 的 计算 机 隐私 策略 的 复印 件 ， 为 了 符合 该 策略 的 要 求 ， 确 定 在 
你 使 用 计算 机 工作 时 是 否 有 需要 改变 的 地 方 。 
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Web 资 源 

。http://hoohoo.ncsa.uiuc.edu/cgi/ 完整 的 来 自 NCSA 的 CGI 规范 的 信息 。 

http://www.w3.0rg/CGH W3C 关 于 CGI 的 页 面 。 

。http://www.w3.org/MarkUp/ W3C 关 于 HTML 和 XHTML 的 主页 。 

。http:Wwww.netcraft.com/survey/ ”Netcraft Web Server Survey 跟 踪 Web 服 务 器 的 市 场 份额 以 
及 SSL 站 点 操作 系统 。 

。http://webservercompare.internet.com/webbasics/index.html 关于 Web 服 务 器 的 教程 。 

。 http://staff.plugged.net.au/dwood/xmilc/index.html XMLC 的 教程 ，XMLC 是 一 种 基于 Java 
的 编译 器 ， 可 以 从 HTML 或 XML 文档 中 创建 java 类， 从 而 可 以 重新 创建 文档 。 

。http://xml.apache.org/cocoon/ Java Web 发 布 的 框架 ， 它 将 文档 的 内 容 、 形 式 和 逻辑 分 离 ， 
各 部 分 可 以 独立 地 设计 、 创 建 和 管理 。 

。 http://www.vbxml.com/xsl/tutorials/intro/default.asp XSLT 教 程 ，XSLT 可 以 将 XML 文 件 转 
换 成 HTML 文 件 或 其 他 基于 文本 的 格式 。 

* http://www.cve.mitre.org/ Common Vulnerabilities and Exposures (CVE) 是 一 个 已 知 漏洞 
及 其 他 信息 安全 隐患 的 标准 名 字 列 表 ， 这 些 常 见 漏洞 由 CVE Editorial Board 确 认 ， 并 由 
MITRE 公 司 监控 。CVE 的 目标 是 对 所 有 已 知 的 普遍 漏洞 和 安全 隐患 的 名 字 进 行 标 准 化 。 

* http://www.computerprivacy.org/who/ Americans for Computer Privacy (ACP) 是 一 个 由 100 
多 家 公司 和 40 多 个 协会 组 成 的 机 构 ， 这 些 公司 和 协会 代表 金融 服务 业 、 制 造 业 、 电 信 业 、 
高 科技 和 运输 业 ， 以 及 法 律 实施 、 公 民 自 由 、pro-family 和 纳税 人 组 织 ， 他 们 共同 关心 计 
算 机 隐私 问题 。 

* http:/www.cpsr.org/ Computer Professionals for Social Responsibility (CPSR) 是 一 个 由 计 
算 机 科学 家 和 其 他 关心 计算 机 技术 对 社会 影响 的 人 们 所 组 成 的 公众 联盟 。 


* http://www.epic.org/ Electronic Privacy Information Center (EPIC )。 
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项 目 案例 : 山 景 社区 医院 


医疗 机 构 采 用 电子 形式 维护 它们 的 记录 的 速度 比 其 他 行业 要 慢 得 多 。 不 过 ， 现 在 通过 计算 
机 处 理 所 产 生 的 常见 数据 ， 比 如 化 验 结果 ， 已 经 可 以 通过 计算 机 访问 了 。 然 而 ， 对 于 大 多 数 医 
院 而 言 ， 许 多 信息 仍然 不 能 以 电子 形式 获取 。 例 如 ， 体 检 结 果 、 医 嘱 和 护士 记录 以 及 病人 和 家 
族 病史 等 信息 在 大 多 数 医院 不 能 以 电子 形式 获取 。 不 同 医疗 机 构 和 供应 商 所 开发 的 获取 数据 的 
信息 系统 把 这 些 信息 分 隐 成 了 碎片 ， 阻挠 了 本 来 很 容易 达到 的 系统 共享 的 开发 进程 。 在 哪里 开 
发 医疗 系统 ， 就 能 企 哪 里 看 到 效益 。 比 如 一 个 对 处 方 进行 记录 的 信息 系统 将 由 错误 用 药 、 错 误 
剂量 或 药物 反应 所 引起 的 问题 减少 了 55%。 

项 目 描述 

山 景 社区 医院 的 规划 小 组 认为 医院 可 以 通过 采用 基于 Web 的 解决 方案 改善 其 日 常 运作 。 他 
们 去 了 解 了 一 些 相关 的 系统 ， 这 些 系统 的 作用 在 局 部 安装 后 已 得 到 证 实 。 但 是 ， 他 们 同时 发 现 
这 些 系统 并 不 真正 适用 于 自己 的 医院 ， 因 为 系统 的 性 价 比 很 难 让 人 接受 。 

人 在 考 虑 如 何 为 山 景 社区 医院 的 医疗 系统 开发 … 个 浏览 器 界面 时 ， 应 该 解决 以 下 几 个 问题 : 

“首先 ， 安 全 性 是 第 一 个 要 关注 的 问题 。 病 人 的 健康 信息 由 于 其 敏感 性 需要 高 度 保密 。 

“数据 的 录入 问题 也 很 重要 。 医 生 、 护 上 以 及 其 他 医疗 人 员 必 须 能 够 而 且 也 愿意 将 数据 录 

入 所 提供 的 信息 系统 。 

"如果 决 定 要 实现 一 个 Web 系 统 ， 系 统 的 可 用 性 也 很 关键 。 

。 将 基于 浏览 器 的 系统 与 现 有 系统 集成 起 来 有 多 大 困难 ? 

* 山 景 社区 医院 如 何 向 医疗 机 构 的 财务 部 门 证 明 所 提出 的 系统 的 性 价 比较 高 ? 

* 山 景 社区 医院 如 何 预测 在 工作 中 可 能 会 发 生 的 模式 变化 ? 

“ 随 着 系统 的 变化 ， 组 织 的 政策 和 程序 需要 作出 何 种 相应 的 变化 或 更 改 ? 

项 目 问题 

1) 请 描述 在 计划 委员 会 作出 任何 关于 在 Web 上 提供 更 多 对 病人 而 言 至 关 重 要 的 信息 的 决定 
时 ， 应 考虑 的 隐私 问题 的 范围 和 性 质 。 

2) 请 描述 计划 委员 会 应 考虑 的 数据 录入 问题 。 确 保 数据 录入 由 医生 、 护 士 和 其 他 医疗 人 员 
完成 ， 提 出 能 解决 这 些 问题 的 可 能 方法 。 

3) 医疗 中 心 的 专家 希望 病人 能 更 加 积极 地 参与 自己 的 医疗 中 心 的 建设 。 请 找到 至 少 五 个 可 
访问 的 医疗 Web 站 点 ， 比 较 每 个 站 点 所 提供 的 信息 和 服务 。 提 出 服务 建议 ， 通 过 在 山 景 社区 医 
院 的 Web 站 点 加 入 这 种 服务 ， 使 病人 更 加 积极 地 关注 医疗 中 心 的 建设 。 

4) 利用 计算 机 记录 病人 的 病历 有 哪些 优点 和 缺点 ?请 列 出 你 所 认为 的 优点 和 缺点 。 

项 目 练习 

山 景 社区 医院 计划 委员 会 正在 考虑 三 种 可 以 放 到 在 线 界 面 上 的 业务 功能 。 具 体 如 下 : 

1 安全 性 和 保密 性 方面 : 谁 可 以 访问 这 些 数据 ， 如 何 限 制 访问 ， 所 提出 的 安全 系统 如 何在 
两 者 之 间 折 中 ? 

2) 数据 录入 需求 : 哪些 工作 人 员 录 入 数据 ， 让 每 种 人 员 录 入 数据 的 阻力 有 多 大 ， 如 何 处 理 
这 种 阻力 ? 

3) 山 景 社区 医院 所 期 望 的 收益 : 成 本 是 多 少 。 

下 面 考 虑 有 三 种 可 能 性 : 

1) 在 线 提交 保险 索赔 。 

2) 在 线 提供 病人 的 临床 信息 。 

3) 在 线 实现 供应 链 管理 。 

这 三 种 可 能 性 里 你 认为 应 该 最 先 实现 哪 一 条 ? 为 什么 ? 
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11.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

“定义 下 列 关 键 术 语 ; 数据 仓库 、 运 作 系 统 、 信 息 系统 、 数 据 集 市 、 依 赖 性 数据 集 市 、 独 
立 数据 集 市、 企业 数据 仓库 、 运 作 数 据 存 储 、 主 动 数据 仓库 、 调 和 数据 、 导 出 数据 、 事 
件 、 临 时 数据 、 周 期 数据 、 静 态 抽取 、 增 量 抽取 、 数 据 清 洗 、 刷 新 模式 、 更 新 模式 、 数 
据 转换 、 选 择 、 联 结 、 聚 合 、 星 型 模式 、 粒 度 、 购 物 篮 分 析 、 一 致 性 维度 、 当 化 模式 、, 
OLAP、ROLAP、MOLAP、 数 据 控 掘 和 数据 可 视 化 。 

* 为 什么 往往 在 信息 管理 者 的 需求 和 可 得 到 的 信息 之 间 存 在 “信息 润 沟 ”"， 给 出 两 条 重要 原 


因 。 

“为 什么 当今 大 多 数组 织 都 需要 数据 仓库 ， 列 举 两 条 主要 原因 。 

* 命名 并 简要 描述 数据 仓库 的 三 层 体系 结构 。 

“ 列 出 数据 调和 的 四 个 主要 步骤 。 

* 描述 星 型 模式 的 两 个 主要 组 成 部 分 。 

“ 给 定 合理 的 数据 库 维度 ， 估 算 一 个 事实 表 的 行 数 和 总 的 字 节 数 。 

“设计 一 个 数据 集 市 ， 使 用 不 同 的 方案 对 维度 进行 规范 化 和 非 规范 化 ， 说 明 事 实 的 历史 记 
录 并 改变 维度 的 属性 值 。 


11.2 引言 


众所周知 ， 易 于 获得 的 高 质量 的 信息 在 当今 的 业务 中 起 着 至 关 重 要 的 作用 。 让 我 们 看 看 两 
个 数据 管理 专家 的 有 关 陈 述 : 
在 今天 的 业务 环境 中 ， 信 息 是 最 为 关键 的 。 成 功 取决 于 及 早 而 果断 地 使 用 信息 。 
缺乏 信息 就 意味 着 失败 。 迅 速 变化 的 业务 运作 环境 要 求 对 数据 进行 更 为 及 时 的 访问 
(Devlin, 1997 ) 。 
许多 企业 正在 积极 寻求 新 技术 ， 以 帮助 他 们 获得 更 高 的 利润 并 且 更 具 竞争 力 ， 要 
想 获得 竟 争 力 ， 就 要 求 这 些 公司 加 快 他们 制定 决策 的 速度 ， 以 便于 对 变化 作出 快速 反 
应 。 加 快 决策 速度 的 关键 就 是 在 正确 的 时 间 拥 有 易于 访问 的 正确 信息 (Poe， 1996 ) 。 
根据 上 面 所 强调 的 信息 的 作用 和 近来 信息 技术 的 发 展 ， 你 可 能 以 为 大 多 数组 织 都 拥有 开发 
完善 的 系统 并 且 能 够 向 管理 者 和 其 他 用 户 提 供 信息 。 然 而 ， 这 种 情况 却 并 不 多 见 。 实 际 上 ， 尽 
管 有 海量 的 数据 和 众多 的 数据 库 ， 但 组 织 只 掌握 他 们 所 需要 信息 的 一 小 部 分 。 管 理 者 常常 为 不 
能 访问 或 使 用 他 们 所 需要 的 数据 和 信息 而 倍 感 困 扰 。 

现代 组 织 淹没 在 数据 当中 但 却 渴 望 信息 。 尽 管 这 句 话 只 是 一 个 比喻 ， 但 却 非常 形象 地 描述 
了 许多 组 织 的 现状 。 为 什么 企业 会 陷 人 这 种 境地 呢 ? 有 两 条 重要 原因 导致 大 多 数组 织 出 现 信息 
凋 沟 。 

出 现 信 息 鸿 沟 的 第 一 条 原因 是 ， 多 年 以 来 ， 大 多 数组 织 一 直 以 分 散 的 方式 开发 信息 系统 及 
其 支持 系统 的 数据 库 。 本 书 强调 系统 开发 应 该 在 仔细 规划 的 结构 化 方法 基础 之 上 展开 ， 并 产生 
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一 个 集成 的 数据 库 集 合 。 然 而 ， 在 现实 中 ， 由 于 时 间 和 资源 的 约束 ， 大 多 数组 织 采 取 “ 一 次 做 
一 件 事 情 ” 的 方式 开发 信息 系统 的 一 部 分 。 这 种 方法 必然 会 产生 一 个 不 协调 的 并 且 经 常 是 不 一 
致 的 数据 库 。 通 常 ， 数 据 库 基 于 不 同 的 软 硬 件 平 台 。 在 这 种 环境 中 ， 对 于 管理 者 而 言 ， 要 想 准 
确 地 定位 并 使 用 信息 几乎 是 不 可 能 的 ， 必 须 跨越 不 同 的 记录 系统 进行 组 合 。 

产生 信息 砚 沟 的 第 一 条 原因 是 ， 大 多 数 系统 是 为 了 支持 运作 处 理 而 开发 的 ， 很 少 或 没有 考 
虐 到 制定 决策 所 需 的 信息 或 分 析 工 具 。 运 作 处 理 (operational processing) 也 叫做 事务 处 理 ， 
用 来 锋 取 、 存 储 并 操纵 支持 组 织 日 常 运作 的 数据 。 而 信息 处 理 (informational processing) 则 
是 分 析 数 据 或 其 他 信息 形式 以 支持 决策 的 制定 。 这 两 种 类 型 处 理 所 需 要 的 数据 类 型 和 所 执行 的 
处 理 截然 不 同 ， 下 一 节 将 会 详细 解释 这 两 种 处 理 的 区 别 。 大 多 数 自行 开发 的 系统 或 直接 从 软件 
供应 商 那里 购 头 的 系统 都 是 为 支持 运作 处 理 而 设计 的 ， 很 少 会 考虑 到 信息 处 理 的 需求 。 

数据 仓库 (data warehouse) 是 弥补 信息 锁 沟 的 桥梁 ， 它 合并 和 集成 来 自 许多 内 部 和 外 部 
资源 中 的 信息 ， 以 作出 准确 的 业务 决策 为 目的 来 安排 它们 (Martin, 1997a)。 通 过 利用 诸如 趋 
势 分 析 、 上 日 标 营销 、 竞 争 性 分 析 、 客 户 关 系 管理 等 应 用 程序 ， 它 们 能 够 帮助 高 级 管理 人 员 、 经 
理 以 及 业务 分 析 人 员 作 出 复杂 的 业务 决策 。 数 据 仓 库 已 经 朝 着 满足 上 述 需 要 但 并 不 打 乱 现 有 运 
作 处 理 的 方向 发 展 。 

由 于 数据 仓库 是 一 个 涵盖 诸多 内 容 的 主题 ， 要 想 全 面 解释 它 需 要 一 本 书 的 篇 幅 ， 所 以 本 章 
仅 对 其 作 简要 介绍 。 事 实 上 ， 大 多 数 关于 该 主题 的 著作 都 只 是 论述 其 中 的 某 一 个 方面 ， 比 如 数 
据 仓库 设计 或 管理 。 本 章 的 内 容 主 要 集中 在 与 数据 库 管 理 相 关 的 两 个 方面 : 数据 仓库 体系 结构 
和 数据 库 设 计 。 在 本 章 中 ， 首 先 将 学 习 数据 仓库 是 如 何 与 现 有 的 运作 系统 相关 联 的 。 接 着 将 介 
绍 .= 层 数 据 体系 结构 ， 这 种 结构 对 于 大 多 数 数据 仓库 环境 都 非常 合适 。 然 后 ， 我 们 着 重 介绍 从 
现 有 运作 系统 抽取 数据 的 问题 ， 以 及 如 何 将 这 些 数据 装 入 数据 仓库 。 接 下 来 ， 我 们 讨论 在 数据 
仓库 中 经 常用 到 的 数据 库 设 计 元 素 。 最 后 ， 阐 述 用 户 如 何 与 数据 仓库 交互 ， 内 容 包 括 联机 分 析 
处 理 、 数 据 挖掘 和 数据 可 视 化 。 


11.3 数据 仓库 的 基本 概念 


数据 仓库 (Data Warehouse, DW) 是 一 种 面向 主题 的 、 集 成 的 、 随 时 间 变 化 的 、 不 可 更 新 
的 数据 集合 ， 用 于 支持 决策 制定 过 程 管理 和 业务 的 智能 化 (Immon 和 Hackathorn，1994)。 该 
定义 中 的 关键 术语 的 含义 如 下 : 

1) 面向 主题 ”数据 仓库 围绕 企业 的 关键 主题 (或 高 级 实体 ) 而 组 织 ， 这 些 主题 包括 客户 、 
病人 、 学 生 、 产 品 和 时 间 等 主题 。 

2) 集成 ”数据 仓库 中 存放 的 数据 采用 统一 的 命名 规则 、 格 式 和 编码 结构 进行 定义 ， 相 关 特 
征 从 若干 内 部 的 记录 系统 及 组 织 外 部 的 资源 中 收集 得 来 。 

3) 随时 间 变 化 数据 仓库 里 的 数据 包含 一 个 时 间 维度 ， 因 此 可 用 来 研究 趋势 和 变化 。 

4) 不 可 更 新 数据 仓库 里 的 数据 从 运作 系统 中 装载 和 更 新 ， 而 不 能 由 终端 用 户 来 更 新 。 

数据 仓库 不 仅仅 只 是 组 织 中 所 有 运作 系统 的 合并 。 因 为 它 主 要 关注 业务 的 智能 化 、 外 部 数 
据 及 随时 间 变 化 的 数据 (不 只 是 当前 状态 ) 上 ， 所 以 数据 仓库 是 一 种 独特 的 数据 库 。 

数据 仓库 是 一 个 过 程 ， 组 织 通 过 使 用 数据 仓库 从 所 拥有 的 信息 资源 中 抽取 其 含义 ， 并 最 终 
制定 出 决策 (Barquin，1996)。 数 据 仓 库 是 信息 技术 中 的 新 成 员 。 虽 然 它 在 15 年 前 才 出 现 ， 但 
其 飞速 发 展 已 使 其 成 为 信息 系统 的 热点 领域 之 一 。 研 究 显 示 ， 超 过 90% 的 大 型 企业 或 者 拥有 数 
据 仓库 或 者 正在 创建 数据 仓库 。1996 年 出 台 的 一 份 对 62 个 数据 仓库 项 目的 研究 显示 ， 项 目的 平 
均 投 资 回 报 率 为 321%， 平 均 投 资 回收 期 为 2.73 年 。 
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11.3.1 数据 仓库 的 历史 简介 

作为 信息 系统 领域 在 过 去 几 十 年 里 不 断 发 展 的 结果 ， 数 据 仓 库 出 现 了 。 其 中 有 如 下 几 个 关 
键 的 进步 : 

。 数 据 库 技 术 的 进步 ， 尤 其 是 关系 数据 模型 和 关系 数据 库 管 理 系 统 (RDBMS) 的 发 展 。 

* 计算 机 硬件 的 进步 ， 尤 其 是 大 容量 存储 器 和 并 行 计算 机 体系 结构 的 出 现 。 

"终端 用 户 计算 的 出 现 以 及 与 之 相 辅 的 功能 强大 的 、 直 观 的 计算 机 界面 和 工具 。 

。 中 间 件 产品 的 进步 ， 使 跨 异 构 平台 的 企业 数据 库 连 接 成 为 可 能 。 

对 运作 (或 事务 处 理 ) 系统 (有 时 也 叫做 记录 系统 ， 因 为 它们 的 作用 就 是 维持 组 织 中 官方 
的 、 合 法 的 记录 ) 和 信息 (或 决策 支持 ) 系统 之 间 本 质 区 别 的 认 知 (以 及 随后 的 定义 ) 是 促进 
数据 仓库 发 展 的 关键 发 现 。 基 于 这 种 差异 ，Devlin 和 Murphy 在 1988 年 发 表 了 第 一 篇 描述 数据 仓 
库 体 系 结构 的 文章 。1992 年 ，Inmon 出 版 了 第 一 本 描述 数据 仓库 的 书 ， 后 来 他 成 为 该 领域 最 多 
产 的 作家 。 

11.3.2 为 什么 需要 数据 仓库 

大 多 数组 织 需要 数据 仓库 的 原因 主要 有 以 下 两 个 : 

1) 在 业务 上 需要 一 种 集成 的 、 拥 有 高 质量 信息 的 公司 范围 的 视图 。 

2) 为 了 显著 改善 管理 公司 数据 时 的 性 能 ， 信 息 系 统 部 门 必须 将 信息 系统 从 运作 系统 中 刊 离 
出 来 。 

1. 需要 公司 范围 的 视图 

通常 情况 下 ， 运 作 系统 中 的 数据 是 分 割 开 并 且 不 一 致 的 。 而 且 ， 它 们 还 分 布 在 各 种 不 相 兼 
容 的 软 人 硬件 平台 上 。 例 如 ， 一 个 包含 顾客 数据 的 文件 可 能 存放 在 一 台 基 于 Unix 的 运行 Oracle 
DBMS 的 服务 器 上 ， 而 另 一 个 文件 则 位 于 一 台 运 行 DB2 DBMS 的 IBM 主 机 上 。 但 是 为 了 进行 决 
策 ， 有 必要 提供 一 个 联合 的 信息 视图 。 

为 了 便于 理解 获得 一 个 联合 的 视图 的 难度 ， 请 参见 图 11-1 所 示 的 简单 例子 。 图 中 显示 来 自 
三 个 不 同 记录 系统 的 三 张 表 ， 每 张 表 都 包含 一 些 学 生 数 据 。 表 STUDENT_DATA 来 自 班级 注册 
系统 ， 表 STUDENT_EMPLOYEE 来 自 个 人 系统 ， 而 表 STUDENT_HEALTH 来 自 健康 中 心 系统 。 
每 张 表 都 包含 有 一 些 与 学 生 相 关 的 惟一 的 数据 。 然 而 ， 每 张 表 都 包含 的 公共 数据 (如 学 生 姓 名 ) 
却 以 不 同 格式 存储 。 

假设 要 为 每 个 学 生 构 造 一 张 简 表 ， 在 其 中 以 一 一 种 文件 格式 合并 所 有 的 数据 ， 那 么 需要 解决 
如 下 问题 : 

* 不一致 的 键 结构 前 两 张 表 的 主键 是 学 生 的 社会 安全 号 ， 而 第 三 张 表 的 主键 是 学 生 的 姓 

名 (Student_Name ) 。 

“ 同 义 字 在 表 STUDENT_DATA 中 ， 主 键 被 命名 为 Student_No， 而 在 表 STUDENT_ 

EMPLOYEE 中 ， 主 键 被 命名 为 Student_ID (本 书 第 5 章 论 述 了 如 何 处 理 同 义 字 )。 

。 自 由 形式 字段 与 结构 化 字段 的 差别 在 表 STUDENT_HEALTH 中 ，Student_Name 是 一 个 

单独 的 字段 ， 而 在 表 STUDENT_DATA 中 ,学 生 名 (复合 属性 ) 被 分 解 为 几 个 组 成 部 分 : 

Last_Name、 MI 和 First_Name。 

"不 一 致 数据 值 ”Elaine Smith 在 表 STUDENT_DATA 中 有 一 个 电话 号 码 ， 在 表 

STUDENT_HEALTH 中 又 有 一 个 不 同 的 号 码 。 这 是 个 错误 ， 还 是 他 本 来 就 有 两 个 电话 号 

码 呢 ? 

。 缺失 数据 “Elaine Smith 在 表 STUDENT -ALTH 中 Insurance 字 段 的 值 被 韶 汤 了 (或 者 是 

空 值 ) 。 该 如 何 确定 这 个 值 呢 ? 
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STUDENT_EMPLOYEE 


Student_ID Address 





123-45-6789 | 1218 Elk Drive, Phoenix, AZ 91304 








134 Mesa Road, Tempe, AZ 90142 
STUDENT_HEALTH 


re | 


图 11-1 异 构 数据 示例 


这 个 简单 的 示例 说 明 在 开发 一 个 联合 视图 时 ， 未 能 抓 住 该 任务 的 复杂 性 。 在 现实 生活 中 ， 
我 们 常常 会 遇 到 几 十 (甚至 数 百 ) 个 文件 和 成 千 上 万 条 (甚至 是 几 百 万 条 ) 记录 。 在 本 章 后 面 
部 分 还 要 详细 讲述 复杂 度 和 尺寸 问题 。 

为 什么 组 织 要 把 不 同 的 记录 系统 中 的 数据 集合 到 一 起 呢 ? 当然 ， 其 根本 原因 是 希望 提高 利 
润 、 更 富有 竞争 性 或 者 通过 增加 顾客 价值 而 使 企业 增长 。 可 以 通过 加 快 决策 的 速度 和 灵活 性 、 
改善 业务 过 程 或 者 通过 更 清楚 地 理解 顾客 行为 而 达到 上 述 目 的 。 对 于 前 面 的 学 生 例子 而 言 ， 大 
学 的 管理 者 可 能 想 调 查 学 生 的 健康 或 在 校园 里 的 学 习 时 间 是 否 与 他 们 的 学 业 成 绩 有 关 ， 选 修 其 
门 课程 是 否 与 学 生 的 健康 有 关 ， 或 者 成 绩 不 佳 者 是 否 需要 更 多 支持 ， 比 如 ， 由 于 增加 的 卫生 保 
健 费 用 以 及 其 他 费用 。 一 般 而 言 ， 组 织 的 某 种 趋势 会 促进 对 数据 仓库 的 需求 。 这 些 趋势 包括 以 
下 几 个 方面 : | 

* 没有 记录 系统 ”几乎 没有 哪 一 个 组 织 只 有 一 个 数据 库 。 好 像 很 奇怪 ， 不 是 吗 ? 还 记得 我 

们 在 第 1 章 里 讨论 过 的 关于 比较 数据 库 与 单独 的 文件 处 理 系统 的 原因 吗 ?因为 在 不 同 的 运 

作 设置 下 需要 异 构 的 数据 ， 因 为 公司 合并 和 收购 ， 或 者 纯粹 是 因为 组 织 的 规模 较 大 ,所 

以 并 存 着 多 个 运作 数据 库 。 

。 多 个 系统 没有 同步 要 使 单独 的 数据 库 达 到 一 臻 是 极其 困难 的 ， 既 使 是 由 同一 个 数据 管 

理 员 控制 的 同样 的 元 数据 (参见 第 13 章 )， 相 同属 性 的 数据 值 也 不 会 一 致 。 这 是 因为 名 数 

据 库 的 更 新 周期 不 同 ， 而 且 是 在 不 同 的 位 置 为 每 个 系统 捕获 同样 的 数据 。 因 此 ， 要 想 得 

到 一 个 组 织 视图 ， 必 须 在 一 个 附加 数据 库 中 定期 地 合并 和 同步 来 自 不 同系 统 的 数据 。 实 
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际 . 上 ， 我 们 将 可 能 看 到 两 个 这 样 的 联合 数据 库 一 一 一 个 称 为 运作 数据 存储 ， 另 一 个 则 称 
为 企业 数据 仓库 ， 两 者 都 包含 在 数据 仓库 的 主题 下 。 
“ 组 织 希 望 以 一 种 平衡 方式 来 分 析 某 些 活动 ”许多 组 织 已 经 实现 了 某 种 形式 的 平衡 记分 
卡 一 一 同时 展示 该 组 织 在 财务 、 人 力 资源 、 客 户 满意 度 、 产 品质 量 及 其 他 指标 的 成 果 
的 度量 手段 。 为 了 确保 这 个 组 织 的 多 维 视图 能 够 显示 一 致 的 结果 ， 必 须 有 数据 仓库 。 
平衡 记分 卡 出 现 问题 时 ， 与 数据 仓库 协同 工作 的 分 析 软 件 可 用 来 以 “下 钼 ”( Drill- 
Down)、 “切片 和 切 块 "、 可 视 化 以 及 其 他 方式 挖掘 业务 智能 。 
“客户 关系 管理 ”各行 各 业 的 组 织 都 认识 到 拥有 一 个 与 客户 在 所 有 接触 点 上 交互 的 完整 视 
图 是 非常 有 价值 的 。 不 同 的 接触 点 〈 比 如 ， 对 银行 来 说 ， 这 些 接触 点 包括 ATM、 出 纳 员 、 
资金 电子 转账 、 投 资 证 券 组 合 管理 以 及 贷款 等 ) 由 不 同 的 运作 系统 提供 支持 。 因 此 ， 如 
果 没 有 数据 仓库 ， 当 银行 出 纳 员 的 屏幕 上 自动 显示 出 一 大 笔 反常 的 存款 业务 时 ， 他 可 能 
不 知道 去 尝试 越 区 向 客户 推销 一 种 银行 的 共有 基金 。 或 者 ， 一 家 信息 技术 公司 为 了 保障 
客户 利益 ， 给 所 有 寻求 帮助 的 电话 区 分 优先 级 ; 销售 人 员 也 想 为 了 保障 客户 利益 建立 客 
户 联系 计划 。 在 给 定 客户 的 前 提 下 ， 获 得 公司 所 有 活动 的 完整 视图 需要 从 不 同 的 运作 系 
统 中 合并 数据 。 
* 供应 商 关系 管理 ”对 许多 组 织 而 言 ， 供 应 链 管 理 也 已 成 为 降低 成 本 和 提高 产品 质量 的 至 
关 重 要 的 因素 。 这 些 组 织 希望 在 他 们 与 供应 商 之 间 活 动 的 完整 视图 的 基础 上 ， 从 开 账 单 
到 确定 交 货 日 期 、 质 量 控制 、 价 格 、 售 后 支持 等 方面 建立 战略 性 的 供应 商 合作 关系 。 这 
些 不 同 活动 的 数据 可 能 锁定 在 不 同 的 运作 系统 当中 (如 应 付款 ， 发 货 和 收 货 ， 生 产 进 度 
安排 ， 维 护 )。 企 业 资 源 规划 (Enterprise Resource Planning, ERP) 系统 通过 把 这 些 数 据 
放 进 一 个 数据 库 来 改善 这 种 状况 。 然 而 ， ERP 系 统 主要 用 于 优化 运作 ， 而 不 是 进行 信息 
或 分 析 处 理 。 
2. 需要 区 分 运作 系统 和 信息 系统 
运作 系统 (operational system) 基于 当前 数据 ， 实 时 执行 某 种 业务 。 运 作 系统 的 例子 有 销 
售 订单 处 理 、 预 约 系统 、 病 人 登记 系统 等 。 运 作 系统 必须 处 理 大量 相 对 简单 的 读 / 写 事务 ， 同 
时 作出 快速 反应 。 运 作 系 统 也 称 为 记录 系统 。 
信息 系统 (information system) 则 是 在 历史 数据 和 预测 数据 的 基础 上， 用 来 进行 决策 支持 
的 系统 。 它 们 也 可 用 于 复杂 查询 或 数据 挖 据 应 用 。 信 息 系 统 的 例子 有 : 销售 趋势 分 析 、 顾 客 划 
分 、 人 力 资 源 规划 等 。 
信息 系统 和 运作 系统 之 间 的 主要 差异 见 表 11-1。 这 两 种 类 型 的 处 理 几乎 在 每 个 比较 类 别 中 
都 具有 截然 不 同 的 特征 。 特 别 需要 注意 的 是 : 这 两 种 处 理 的 用 户 群 截然 不 同 。 运 作 系统 主要 由 
那些 负责 处 理 日 常事 务 的 职员 、 管 理 员 、 销 售 人 员 及 其 他 人 员 使 用 。 而 信息 系统 则 是 由 那些 搜 
索 状 态 信息 和 制定 决策 的 经 理 、 高 层 管理 人 员 、 业 务 分 析 人 员 以 及 某 些 顾客 使 用 。 


表 11-1 运作 系统 和 信息 系统 的 比较 





特 征 运作 系统 信息 系统 

主要 目的 在 当前 基础 上 执行 业务 支持 管理 者 制定 决策 

数据 类 型 当前 业务 状态 的 表示 历史 的 时 间 点 (快照 ) 和 预测 

上 让 要 用 户 职员 、 销 售 人 员 、 管 理 员 经 理 、 业 务 分析 人 员 、 磊 客 

使 用 范围 范围 较 小 的 、 事 先 规划 好 的 、 简 单 的 更 新 和 查询 范围 广泛 的 、 特 殊 的 、 复 杂 的 查询 和 分 析 
设计 目标 性 能 否 吐 其， 实用 性 炎 活 的 访问 和 使 用 

容 艺 在 一 个 或 几 个 表格 行 上 进行 大 量 的 、 固 定 的 更 新 定期 的 成 批 更 新 和 查询 ， 需 要 很 多 甚至 全 


和 查询 部 的 表格 行 
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区 分 运作 系统 与 信息 系统 主要 基于 以 下 三 个 因素 : 

1) 数据 仓库 对 散布 在 各 不 相同 的 运作 系统 中 的 数据 加 以 集中 ， 并 将 它们 用 于 决策 支持 。 

2) 一 个 良好 设计 的 数据 仓库 通过 改善 数据 质量 和 数据 一 致 性 ， 增加 数据 价值 。 

3) 一 个 单独 的 数据 仓库 可 以 消除 许多 由 于 混淆 信息 应 用 和 运作 处 理 而 产生 的 对 于 资源 的 争 
用 。 


11.4 数据 仓库 的 体系 结构 


经 常用 到 的 数据 仓库 基本 体系 结构 有 三 种 。 首 先 ， 是 一 种 一 般 的 、 适合 初级 数据 仓库 应 用 
的 两 层 物理 体系 结构 ; 其 次 ， 是 一 种 扩展 的 、 适 用 于 较 复 杂 环 境 的 : 层 体 系 结构 ; 最 后 ， 是 一 
种 与 三 层 物理 体系 结构 相关 联 三 层 数据 体系 结构 。 

11.4.1 一 般 的 两 层 体系 结构 
一 般 的 数据 仓库 体系 结构 如 图 11-2 所 示 。 建 立 一 个 这 样 的 体系 结构 需要 以 下 四 个 基本 步 又 。 
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图 11-2 一 般 的 两 层 数 据 仓库 体系 结构 


1) 从 各 种 内 部 和 外 部 的 源 系 统 文件 及 数据 库 中 抽取 数据 。 在 大 型 企业 中 ， 可 能 有 成 百 上 后 
个 这 样 的 文件 和 数据 库 。 

2) 来 自 不 同 源 系 统 的 数据 在 载 入 数据 仓库 之 前 必须 经 过 转换 和 集成 。 某 些 事务 可 能 会 返回 
源 系 统 以 校正 在 数据 分 级 时 发 现 的 错误 。 

3) 数据 仓库 是 为 了 支持 决策 制定 而 组 织 的 数据 库 。 它 包含 详细 数据 和 汇总 数据 。 

4) 用 户 通过 多 种 查询 语言 和 分 析 工 具 访问 数据 仓库 ， 访 问 结果 (如 预测 或 预报 ) 可 以 反馈 
至 数据 仓库 和 运作 数据 库 。 

在 后 面 的 几 节 里 我 们 还 会 详细 讨论 从 源 系统 向 数据 仓库 抽取 、 转 换 、 装 载 (ETL) 数据 的 
重要 步 又 ， 以 及 各 种 终端 用 户 表示 工具 。 

抽取 和 装载 要 以 一 定 的 周期 进行 ， 比 如 一 天 、 一 周 或 一 个 月 。 因此， 数据 仓库 常常 不 具有 、 
也 不 需要 具有 当前 的 数据 。 请 记 住 ， 数 据 仓库 并 不 支持 运作 事务 处 理 ， 尽 管 它 可 能 包含 有 事务 


362 。 锣 四 部 分 笑 现 





性 数据 〈 不 过 ， 更 多 的 是 事务 的 汇总 和 状态 变量 的 快照 ， 如 账目 结算 和 库存 水 平等 )。 对 大 多 
数 数据 仓库 应 用 而 言 ， 用 户 并 不 是 希望 发 现 对 单个 事务 的 反应 ， 而 是 希望 在 数据 仓库 的 一 个 大 
的 子 集 上 寻找 组 织 状 态 的 趋势 和 模式 。 如 果 数 据 仓库 中 保存 了 至 少 五 个 财政 季度 的 数据 ， 那 么 
至 少 可 以 了 解 年 度 趋势 和 模式 。 旧 的 数据 可 以 被 清洗 或 存档 。 后 面 我 们 将 看 到 一 种 先进 的 数据 
仓库 体系 结构 主动 数据 仓库 ， 它 基于 对 当前 数据 需求 的 不 同 假设 而 生成 。 
11.4.2 独立 数据 集 市 的 数据 仓库 环境 

与 截止 到 目前 本 章 所 讨论 的 许多 原则 相反 ， 某 些 组 织 并 不 总 是 创建 一 个 数据 仓库 ， 而 是 创 
建 若 干 独立 的 数据 集 市 ， 每 个 数据 集 市 都 基于 数据 仓库 和 数据 库 技 术 ， 但 并 不 进行 事务 处 理 ， 
数据 集 市 (data mart) 是 限定 在 一 定 范围 内 的 数据 仓库 。 它 的 内 容 可 以 来 自 于 独立 的 ETL 过 程 ， 
如 图 11-3 所 示 的 独立 数据 集 市 (independent data mart) ; 也 可 以 来 自 数据 仓库 ， 相 关内 容 将 在 
『 面 两 节 讨 论 。 数 据 集 市 是 为 了 特定 的 终端 用 户 组 的 决策 应 用 而 专门 定制 的 。 因 此 ， 数 据 集 市 
用 于 优化 良好 定义 和 可 预测 用 途 的 性 能 ， 有 时 其 至 只 有 一 条 或 几 条 查询 。 例 如 ， 为 了 支持 特定 
目的 分 析 处 理 ， 某 个 组 织 可 以 建立 一 个 营销 数据 集 市 、 一 个 财务 数据 集 市 、 一 个 供应 链 数据 集 
市 等 等 。 
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建 模 /查询 结 果 
图 11-3 独立 数据 集 市 的 数据 仓库 体系 结构 


后 面 我 们 将 对 各 种 数据 仓库 的 体系 结构 进行 比较 ， 不 过 ， 目 前 已 经 可 以 看 到 独立 数据 集 市 
策略 的 一 个 明显 特征 ， 当 终端 用 户 需要 访问 单独 数据 集 市 的 数据 时 比较 复杂 (从 连接 所 有 数据 
集 市 和 终端 用 户 表示 工具 之 间 互 相交 又 的 连 线 就 可 以 证 明 这 一 点 )。 这 种 复杂 性 不 仅 源 于 不 得 
个 访问 单 独 的 数据 集 市 数据 库 ， 而 且 还 源 于 多 个 数据 集 市 可 能 产生 新 的 数据 系统 不 一 致 。 如 果 
在 所 有 的 数据 集 市 之 上 只 有 一 组 元 数据 ， 并 且 如 果 在 数据 分 级 区 的 活动 中 所 有 的 数据 集 市 保持 
一 致 的 话 〈 例 如 ， 通 过 图 11-3 所 示 数 据 分 级 区 中 的 “一 致 性 维度 ")， 那 么 对 于 终端 用 户 而 言 的 
复杂 性 就 降低 了 。 在 图 11-3 中 ，ETL 过 程 的 复杂 性 不 太 明显 ， 因 为 针对 每 个 独立 数据 集 市 都 需 
要 建立 单独 的 转换 和 装载 过 程 。 

组 织 采 用 这 种 体系 结构 的 原因 只 是 为 了 方便 ， 因 为 建立 一 些小 的 、 独 立 的 数据 仓库 总 要 此 
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让 所 有 部 门 都 与 一 个 中 心 数据 仓库 的 组 织 视图 保持 一 致 ， 在 组 织 和 策略 上 更 简单 … 些 。 而 且 ， 
某 些 数据 仓库 技术 在 所 支持 的 数据 仓库 大 小 上 有 限制 一 一 我 们 在 后 面 将 其 称 为 可 伸缩 性 问题 。 
因此 ， 如 果 在 了 解数 据 仓库 需求 之 前 ， 就 把 自己 限定 在 一 个 特定 的 数据 仓库 技术 集中 ， 才 么 数 
据 仓 库 的 体系 结构 可 能 就 是 由 技术 而 不 是 由 业务 来 决定 的 。 在 下 一 节 里 ， 通 过 和 与 其 最 有 竞争 
力 的 体系 结构 进行 比较 来 讨论 独 谋 数据 集 市 体系 结构 的 优 劣 。 
11.4.3 依赖 数据 集 市 和 运作 数据 存储 的 体系 结构 

图 11-3 所 示 的 独立 数据 集 市 的 体系 结构 有 如 下 几 个 较 大 的 局 限 性 (Meyer. 1997): 

1) 为 每 个 数据 集 市 都 必须 开发 单独 的 ETL 过 程 ， 这 将 导致 大 量 的 完 余 数据 和 极 大 的 开发 工 
作 量 。 

2) 数据 集 市 之 间 可 能 并 不 一 致 , 因此 不 能 提供 一 个 包括 顾客 、 供 应 商 和 产 贞 等 重要 十 题 的 、 
清晰 的 企业 级 数据 视图 。 

3) 不 能 从 其 他 数据 集 市 或 共享 的 数据 信息 库 中 抽取 更 多 的 细节 或 相关 事实 、 所 以 ， 给 分 析 
造成 了 - - 些 难 度 〔〈 比 如 ， 不 能 为 不 同 数 据 集 市 在 不 同 乎 台 上 进行 联结 操作 )。 

关于 独立 数据 集 市 的 价值 问题 已 经 引起 了 极 大 的 争议 。Kimball (1997) 强烈 支持 以 独立 
数据 集 市 应 作为 决策 支持 系统 阶段 性 发 展 的 可 行 策略 。Armstrong ( 1997) 和 Inmon (1997 与 
2000) 认为 这 种 看 法 是 错误 的 。 其 实 ， 围 绕 独 立 数据 集 市 主要 在 两 个 方面 存在 争论 : 

1) 关于 实现 数据 仓库 环境 的 阶段 性 方法 的 性 质 。 争 论 的 焦点 是 : 数据 集 市 是 看 应 该 运 渐 进 
化 为 决策 支持 数据 的 企业 级 定义 的 子 集 。 

2) 关于 何 种 数据 库 体 系 结构 适用 于 分 析 处 理 。 争 论 的 焦点 是 : 数据 集 市 的 数据 库 应 规范 化 
到 什么 程度 。 

上 述 两 个 争论 的 焦点 将 贯穿 本 章 。 而 且 ， 在 本 章 末 尾 有 一 个 练习 专门 深入 地 拧 究 这 两 个 争 
论 。 

解决 独立 数据 集 市 的 局 限 性 的 最 普遍 的 方法 就 是 使 用 依赖 数据 集 市 (dependent data mart) 
和 运作 数据 存储 (Operational Data Store，ODS ) 结构 (如 图 11-4 所 未 )。 通 过 从 企业 数据 仓库 
(Enterprise Data Warehouse, EDW ) 载 入 依赖 数据 集 市 可 以 解决 上 面 的 第 -和 第 条 限制 。 所 
谓 企 业 数据 仓库 ， 就 是 一 个 集成 的 中 心 数 据 仓 库 ， 它 是 决策 支持 应 用 的 终端 用 户 可 以 得 到 的 控 
制 点 和 惟一 的 “事实 版 本 ”"。 依 赖 数 据 集 市 也 是 为 制定 决策 的 用 户 群 提供 一 个 简化 的 、 高 性 能 
的 环境 。 用 户 可 以 访问 自己 的 数据 集 市 ， 在 需要 其 他 数据 时 ， 也 可 以 访问 EDW。 依 赖 数据 集 
市 之 间 的 元 余 可 以 进行 规划 ， 这 些 元 余数 据 是 一 致 的 、 因 为 每 个 数据 集 市 都 是 从 间 一 个 公共 数 
据 源 同步 载 和 的。 数据 集成 是 管理 企业 数据 仓库 的 IT 人 员 的 职责 ， 不 应 该 让 终端 用 户 为 了 每 条 
查询 或 应 用 不 得 不 跨越 若干 独立 数据 集 市 而 进行 数据 集成 。 依 赖 数 据 集 市 和 运作 数据 的 存储 体 
系 结构 通常 称 为 “中 央 辐 射 式 ”方法 ， 其 中 ，EDW 是 中 心 ， 而 源 数据 系统 和 数据 集 市 分 别 位 
于 输入 和 输出 辐射 端 。 

第 三 条 限制 可 以 通过 让 运作 数据 存储 提供 一 个 所 有 运作 数据 的 集成 源 来 加 以 解决 。 运 作 数 
据 存储 (Operational Data Store，ODS) 是 一 种 集成 的 、 面 向 主题 的 、 可 更 新 的 、 县 有 当前 值 
的 详细 数据 库 ， 它 可 以 向 作 决 策 支 持 处 理 的 终端 用 户 提供 服务 (Imhoff，1998; Inmon，1998)。 
ODS 通常 是 关系 数据 库 ， 和 记录 系统 中 的 数据 库 一 样 进行 规范 化 ， 不 过 是 为 决策 制定 应 用 作 
了 调整 。 例 如 ， 可 以 为 了 检索 更 广泛 数据 集 的 查询 ， 而 不 是 为 了 事务 处 理 或 者 查询 单个 的 以 
及 直接 相关 记录 (如 顾客 订单 号 )， ODS 可 以 对 索引 及 其 他 一 些 关系 数据 库 的 设计 元 素 进 行 调 
种 。ODS 包 含 所 有 活动 的 、 企 业 级 的 当前 视图 。 因 为 它 拥有 不 断 变化 的 当前 数据 ， 所 以 在 不 
同时 间 对 ODS 进行 相同 查询 也 可 能 会 得 到 不 同 结果 。ODS 通 常 不 包含 历史 数据 ， 而 EDW 却 党 





担 着 某 一 时 刻 组 织 状态 的 快照 的 历史 数据 。 ODS 的 数据 可 能 来 自 于 ERP 应 用 数据 库 ， 但 是 因为 
大 多 数组 织 不 仅仅 只 有 一 个 ERP 数 据 库 ,- 而 且 也 不 可 能 在 一 个 ERP 上 执行 所 有 操作 ， 所 以 通常 
-个 ODS 并 不 等 同 于 一 个 ERP 数 据 库 。 另 外 ， ODS 并 不 是 用 来 处 理 大 量 事务 性 工作 ， 而 是 用 于 
决策 支持 。ODS 同 时 起 数据 分 级 区 的 作用 ， 将 数据 裁 人 EDW ODS 可 以 立即 从 记录 系统 接收 
数据 ， 也 可 以 有 所 延迟 ， 这 种 特性 对 于 它 所 支持 的 决策 制定 需求 来 说 是 实用 的 、 而 且 也 是 可 
以 接受 的 。 
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建 模 /查询 结果 
图 11-4 依赖 数据 集 市 和 运作 数据 的 存储 体系 结构 


依赖 数据 集 市 和 运作 数据 存储 的 体系 结构 也 被 称 为 企业 信息 L[ (Corporate Information 
otOrY，CIF)( 见 lmhoff，1999)， 我 们 可 以 把 它 看 作 是 一 个 支持 用 户 所 有 数据 需求 的 组 织 数 
据 的 综合 视图 。 

至 便 是 本 领域 的 权威 人 士 ， 他 们 所 赞成 的 数据 仓库 方法 也 非常 不 同 。 支 持 独立 数据 集 市 的 
权威 人 士 认 为 ， 这 种 方法 有 两 个 重大 优点 : 

1) 该 方法 可 以 使 数据 仓库 的 概念 通过 一 系列 小 项 目 得 以 验证 。 

2) 因为 组 织 不 必 等 到 所 有 的 数据 都 集中 起 来 后 再 工作 ， 所 以 从 数据 仓库 中 得 到 收益 的 时 间 
也 得 以 缩短 。 

而 CIF 的 拥护 者 则 提出 了 独立 数据 集 市 方法 所 面临 的 严峻 问题 ， 这 些 问 题 如 下 所 示 
(Inmon, 1999:; Armstrong ,2000): 

1) 数据 集 市 之 间 的 元 余 。 

2) 用 户 自身 需要 多 个 数据 集 市 之 上 的 集成 的 组 织 视图 . 

3) 过 多 ETL 过 程 所 导致 的 额外 工作 。 

外 数据 集 市 由 于 技术 限制 或 每 个 数据 集 市 采用 不 同 的 技术 ， 都 未 能 达到 EDW 的 规模 ， 必 
们 合理 使 用 数据 仓库 技术 的 可 能 性 不 大 。 

5) 维护 数据 集 市 同步 的 代价 高 昂 。 
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Armstrong (2000) 等 人 还 认为 ， 独 立 数据 集 市 的 拥护 者 声称 的 所 谓 好 处 实际 是 采取 阶段 
性 方法 开发 数据 仓库 的 好 处 。 而 阶段 性 方法 也 可 以 在 CIF 架 构 中 实现 ， 并 最 终 实现 为 数据 仓库 
体系 结构 ， 这 是 我 们 在 下 节 中 将 要 讲述 到 的 。 
11.4.4 ”逻辑 数据 集 市 和 主动 仓库 体系 结构 

罗 辑 数据 集 市 和 主动 仓库 体系 结构 仅 适 用 于 中 等 规模 的 数据 仓库 或 采用 高 性 能 数据 仓库 技 
术 (如 NCR Teradata 系 统 ) 的 情况 。 如 图 11-5 所 示 ， 这 种 体系 结构 有 如 下 特征 : 

1) 逻辑 数据 集 市 (logical data mart) 不 是 物理 上 分 开 的 数据 库 ， 而 是 某 个 稍 不 规范 的 、 物 
理 的 关系 数据 仓库 的 不 同 关系 视图 (参见 第 7 章 中 视图 的 概念 )。 

2) 数据 不 经 过 独立 的 分 级 区 就 可 直接 载 入 数据 仓库 ， 从 而 利用 数据 仓库 技术 的 高 性 能 计算 
能 力 执行 数据 的 清洗 和 转换 步骤 。 

3) 由 于 不 需要 建立 物理 数据 库 ， 也 不 需要 精通 相应 的 数据 库 技 术 ， 又 无 需 编写 装载 例 程 ， 
因此 可 以 非常 快速 地 创建 新 的 数据 集 市 。 

4) 因为 只 有 在 需要 时 才 创 建 视图 ， 所 以 数据 集 市 的 数据 都 是 最 新 的 。 如 果 用 户 对 同一 个 数 
据 集 市 的 实例 要 进行 一 连 串 的 查询 和 分 析 ， 那 么 也 可 以 将 视图 物化 。 
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图 11-5 逻辑 数据 集 市 和 主动 仓库 体系 结 松 


无 论 是 逻辑 的 还 是 物理 的 ， 数 据 集 市 和 数据 仓库 都 在 数据 仓库 环境 中 扮演 着 不 同 的 角色 ， 
表 11-2 对 这 些 不 同 之 处 作 了 总 结 。 尽 管 在 规模 上 有 限制 ， 数 据 集 市 也 不 一 定 很 小 。 因 此 ， 可 伸 
缩 技术 非常 关键 。 尽 管 数据 集 市 的 规模 受到 限制 ， 建 立 一 个 数据 集 市 的 复杂 性 较 低 ， 但 其 仍然 
面临 着 ETL 问 题 的 挑战 。 而 且 ， 当 用 户 自己 需要 在 不 同 的 物理 数据 集 市 之 上 集成 数据 的 时 候 
(这 是 极 有 可 能 发 生 的 )， 就 会 面临 巨大 的 负担 和 成 本 。 通 过 不 断 增 加 数据 集 市 的 方法 ， 可 以 分 
阶段 建立 数据 仓库 。 要 想 做 到 这 一 点 ， 最 简单 的 方法 莫 过 于 采用 逻辑 数据 集 市 和 主动 仓库 体系 
结构 了 。 





表 11-2 数据 仓库 与 数据 集 市 的 差别 





数据 仓库 数据 集 市 
范围 范围 
“独立 上 应 用 。 特 定 的 DSS 应 用 
* 集中 的 ， 可 能 是 企业 范围 的 * 不 集中 ， 随 用 户 而 定 
。 事先 规划 的 * 有 机 的 ， 可 能 并 没有 规划 
数据 数据 
* 历史 的 、 详 细 的 、 沪 总 的 *。 部 分 历史 的 、 详 细 的 、 泡 总 的 
。 稍 徽 不 规 花 的 * 高 度 不 规范 的 
主题 主题 
*， 多 主题 *。 用户 关 心 的 某 个 主题 
源 源 
。 许 多 内 部 源 与 外 部 源 *， 几 个 内 部 源 与 外 部 源 
其 他 特征 其 他 特征 
。 火 活 的 。 限 制 的 
* 面 问 数 据 的 * 而 向 项 目的 
“生命 期 长 。 生命 期 短 
。 大 型 “开始 小 ， 逐 渐变 大 
*。 单 .复杂 结构 “多 种 的 、 半 复杂 结构 


注 : 改编 自 Strange (1997)。 


从 图 11-5 所 示 体 系 结构 中 的 主动 数据 仓库 (active data warehouse) 部 分 可 以 看 到 : 因为 需 
要 对 组 织 的 当前 复杂 视图 做 出 快速 反应 ， 所 以 源 数据 系统 和 数据 仓库 之 间 的 数据 交换 是 以 接近 
实时 的 速度 进行 的 。 例 如 ， 回 答 问 题 并 记录 问题 的 客服 人 员 必 须 持 有 顾客 最 近 与 销售 人 员 接触 
的 情况 、 账 单 和 付款 业务 、 维 修 活动 以 及 订单 情况 的 总 体 视图 。 有 了 这 些 信息 ， 客 服部 门 的 系 
统 就 可 以 用 类 似 的 特征 文件 ， 自 动 地 为 专业 人 员 产 生 维 修 合同 、 升 级 产品 、 或 客户 购买 的 其 他 
产品 的 销售 脚本 。 关 键 事件 (如 输入 新 的 产品 订单 ) 可 以 被 立 妈 考虑， 这样， 企业 至 少 能 做 到 
像 顾 客 了 解 自己 一 样 了 解 自己 与 顾客 的 关系 。 最 终 方向 是 使 每 个 事件 (比方 说 是 客户 ) 都 成 为 
一 种 用 户 化 和 个 人 化 交流 的 潜在 机 会 ， 这 种 交流 是 基于 如 何 利用 特定 的 特征 文件 响应 客户 的 战 
略 性 决策 。 受 益 于 主动 数据 仓库 的 应 用 包括 : 

“ 基于 最 新 的 库存 量 实现 变更 交付 的 及 时 运送 。 

“ 电子 商务 应 用 。 比 如 ， 在 用 户 注销 之 前 ， 被 放弃 的 购物 车 可 以 触发 电子 邮件 提示 消息 。 

“信用卡 事务 中 的 欺诈 检测 ， 其 中 某 个 异常 的 事务 模式 可 能 警告 售货员 或 联机 购物 车 例 程 

采取 额外 的 防范 措施 。 

上 述 应 用 通常 都 需要 处 于 联机 状态 、365 天 每 天 24 小 时 向 用 户 提供 访问 。 对 于 任何 一 种 数 
据 仓 库 体系 结构 来 说 ， 用 户 可 能 是 员工 、 顾 客 或 者 合伙 人 。 

若 利用 高 性 能 计算 机 和 数据 仓库 技术 ， 可 能 并 不 需要 将 ODS 与 企业 数据 仓库 分 离 。 当 ODS 
和 EDW 合 二 为 一 时 , 用 户 就 很 容易 在 解决 一 系列 彼此 相关 的 特殊 问题 时 下 钼 和 上 控 (Drill-Up )。 
同时 ， 由 于 消除 了 依赖 数据 集 市 和 运作 数据 存储 体系 结构 层 ， 所 以 这 也 是 一 种 比较 简单 的 体系 
结构 。 
11.4.5 三 层 数据 体系 结构 

图 1-6 显 示 的 是 数据 仓库 的 三 层 数 据 体系 结构 : 

1) 运作 数据 存储 存在 于 整个 企业 的 不 同 运作 记录 系统 中 (有 时 也 存储 在 外 部 系统 中 )。 

2) 调和 数据 是 保存 在 企业 数据 仓库 和 运作 数据 存储 中 的 数据 类 型 。 
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3) 导出 数据 是 存储 在 每 个 数据 集 市 中 的 数据 类 型 。 


数据 集 市 
元 数据 


导出 数据 





数据 集 市 








EDW 元 数据 




















企业 数据 仓库 和 运作 数据 仓储 














企业 数据 模型 | 


运作 元 数据 


运作 系统 





图 11-6 三 层 数据 体系 结构 


调和 数据 (reconciled data) 是 详细 的 当前 数据 ， 并 是 是 所 有 决策 支持 应 用 的 惟一 的 、 权 
威 的 数据 来 源 。 导 出 数据 (derived data) 是 为 了 终端 用 户 的 决策 支持 应 用 系统 而 选择 、 格 式 化 
和 聚集 的 数据 。 

以 下 两 节 将 讨论 调和 数据 和 导出 数据 。 还 有 两 种 在 图 11-6 所 示 体 系 结构 中 非常 关键 的 组 件 ， 
它们 是 企业 数据 模型 和 元 数据 。 

1. 企业 数据 模型 的 作用 

图 11-6 还 显示 出 与 企业 数据 模型 相 链 接 的 调和 数据 层 。 回 忆 一 下 第 2 章 提 到 过 ， 企 业 数 据 
模型 代表 了 一 个 解释 企业 所 需 数据 的 完整 视图 。 如 果 调 和 数据 层 是 决策 支持 所 需要 的 所 有 数据 
的 权威 来 源 ， 那 么 它 就 必须 与 企业 数据 模型 所 指定 的 设计 相 一 致 。 因 此 ， 企 业 数 据 模型 控制 数 
据 仓库 的 阶段 性 发 展 。 通 常 ， 企 业 数据 模型 在 解决 新 问题 和 决策 应 用 系统 的 过 程 中 不 断 演化 。 
一 次 性 开发 企业 数据 模型 要 花费 很 长 时 间 ， 同 时 ， 在 数据 仓库 建 好 之 前 ， 决 策 需求 可 能 会 动态 
地 发 生变 化 。 

2. 元 数据 的 作用 

图 11-6 还 显示 出 与 三 个 数据 层 相 链 接 的 元 数据 层 。 回 忆 一 下 第 1 章 提 到 过 ， 所 谓 元 数据 就 
是 描述 数据 的 性 质 和 特征 的 数据 。 以 下 是 图 11-6 所 示 的 三 种 类 型 元 数据 的 简单 描述 。 

D 运作 元 数据 (operational metadata) 描述 流入 EDW 的 不 同 运作 系统 (也 包括 外 部 数据 ) 
中 的 数据 。 通 常情 况 下 ， 运 作 元 数据 有 各 种 不 同 的 存在 格式 ， 但 质量 较 差 。 

2) EDW 元 数据 (EDW metadata) 由 企业 数据 模型 衍生 而 来 (或 至 少 与 其 相 - 致 )。BDW 
元 数据 既 描 述 调和 数据 层 ， 也 描述 将 运作 数据 转换 为 调和 数据 的 规则 。 

3) 数据 集 市 元 数据 (data mart metadata) 描述 导出 数据 层 ， 以 及 将 调和 数据 转换 为 导出 数 











据 的 规则 。 
11.5 数据 仓库 中 数据 的 若干 特征 


为 了 更 好 地 理解 各 层 中 的 数据 ， 读 者 需要 学 习 数据 储存 在 数据 仓库 中 时 的 一 些 基 本 特征 。 
11.5.1 状态 数据 与 事件 数据 
状态 数据 与 事件 数据 之 闯 的 区 别 如 图 11-7 所 示 。 图 中 显示 一 个 典型 的 由 数据 库 管理 系统 记 
采 的 日 志 条 目 ， 它 记录 了 某 个 银行 应 用 系统 所 处 理 的 一 次 业务 。 该 日 志 条 目 既 包括 状态 数据 也 
包括 事件 数据 :“ 前 象 ” 和 “后 象 ”分 别 代表 银行 账户 在 提 款 之 前 和 提 款 之 后 的 状态 。 图 的 中 
部 显示 的 是 代表 提 款 《或 更 新 事件 ) 的 数据 。 
前 象 





750 











K1234 co | 04/22/2001 





| 
更 新 


K1234 
04/27/2001 事件 ( 提 款 ) 
-50 


| 


| 


后 象 , 


K1234 04/27/2001 


图 11-7 DBMS 日 志 条 目 举例 


事务 即 业务 活动 ， 它 导致 在 数据 库 级 发 生 一 个 或 多 个 业务 事件 (Devlin，1997)， 在 第 12 
章 里 我 们 还 会 进一步 讨论 事务 。 事 件 (event) 则 是 由 事务 产生 的 数据 库 动 作 (创建 、 更 新 或 
删除 )。 注 意 ， 一 个 事务 可 能 引起 一 个 或 多 个 事件 。 图 11-7 中 的 提 款 事务 产生 了 一 个 事件 ， 即 
将 账户 余额 从 750 减 至 700。 另 一 方面 ， 把 钱 从 一 个 账户 转 到 另 一 个 账户 将 会 引发 两 个 事件 : 一 
个 是 提 款 事件 ， 另 一 个 是 存款 事件 。 有 时 ， 一 些 非 事务 性 活动 也 都 是 重要 事件 ， 比 如 ， 一 个 被 
放弃 的 联机 购物 车 、 忙 信号 或 断 开 的 网 络 连接 、 把 某 项 目 放 入 购物 车 但 又 在 结账 前 取出 来 。 

状态 数据 和 事件 数据 都 可 以 存储 到 数据 库 当 中 。 但 在 实际 应 用 中 , 数据 库 (包括 数据 仓库 ) 
中 存储 的 数据 大 多 数 都 是 状态 数据 。 一 个 数据 仓库 可 能 包含 状态 数据 快照 的 历史 记录 ， 也 可 能 
包含 事务 的 汇总 (比如 ， 每 小 时 统计 一 次 总 数 ) 或 事件 数据 。 代 表 事务 的 事件 数据 可 以 定义 其 
存储 时 间 ，、 但 是 在 用 后 需 将 这 些 数据 删除 或 存档 以 节省 存储 空间 。 状 态 数据 和 事件 数据 一 般 都 
存储 在 数据 库 日 志 中 (如 图 11-7 所 示 )， 以 便 在 备份 和 恢复 数据 时 使 用 。 下 面 将 会 解释 数据 库 
日 志 在 填充 数据 仓库 时 所 起 的 重要 作用 。 
11.5.2 临时 数据 与 周期 数据 

在 数据 仓库 中 ， 常 常 需要 维护 一 份 过 去 所 发 生 事件 的 记录 。 例 如 ， 将 现 阶 段 的 销售 水 平 或 
库存 水 平 与 去 年 同一 日 期 或 同一 时 期 的 历史 数据 进行 比较 。 














大 多 数 运 作 系 统 都 基于 临时 数据 (transient data) 的 使 用 。 在 临时 数据 中 ， 对 现存 数据 的 
修改 直接 在 前 面 数 据 的 基础 上 进行 ， 因 此 前 面 的 数据 内 容 会 遭 到 破坏 。 在 不 保存 记录 的 先前 内 
容 的 情况 下 直接 删除 记录 的 情况 也 时 有 发 生 。 

参照 图 11-7， 可 以 很 形象 地 理解 临时 数据 : 假如 后 象 在 前 象 之 上 修改 ， 那 么 前 象 ( 包 含 以 
前 的 余额 ) 就 没有 了 。 不 过 ， 由 于 图 11-7 显 示 的 是 数据 库 日 志 ， 所 以 前 象 、 后 象 通常 都 会 保存 。 

周期 数据 ( periodic data) 一 旦 存 人 就 不 会 被 物理 改变 或 删除 。 图 11-7 中 的 前 象 和 后 象 就 代 
表 周 期 数据 。 注 意 ， 每 条 记录 包含 一 个 时 间 戳 (第 3 章 已 经 介绍 了 时 间 惟 的 使 用 ) ， 指 明 最 近 更 
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新 事件 所 发 生 的 日 期 (如果 需要 的 话 ， 还 可 显示 时 间 )。 


11.5.3 一 个 临时 数据 和 周期 数据 的 例子 
图 11-8 和 11-9 显 示 一 个 更 为 详细 的 比较 


临时 数据 和 周期 数据 的 例子 。 


Table X (10/01) 




















图 11-8 临时 运作 数据 


Table X (10/01) 


a C 
C 

















四 日 
O 








= 
中 















日 目 





图 11-9 周期 仓库 数据 
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1. 临时 数据 

图 11-8 显 示 了 一 个 包含 四 条 初始 记录 的 关系 (Table X)。 该 表 有 三 个 属性 : 一 个 主键 和 两 
个 韭 主键 属性 A 和 B。 每 个 属性 在 日 期 10/01 的 值 在 表 中 都 有 记录 。 例 如 ， 该 日 期 001 记 录 中 属 
性 A 的 值 是 a。 

在 日 期 10/02 中 ， 这 个 表 发 生 三 个 变化 ( 用 箭头 在 表 的 左边 指出 发 生变 化 的 行 )。002 记 录 
被 更 新 ， 属 性 A 的 值 从 c 变 成 r。004 记 录 也 被 更 新 ， 属 性 A 的 值 从 g 变 成 y。 最 后 ， 向 表 中 插入 一 
条 新 记录 ( 主键 为 005 )。 

注意 ，002 记 录 和 004 记 录 得 到 更 新 ， 而 且 新 记录 取代 了 先前 的 记录 。 因 此 ， 先 前 的 值 丢 失 
了 ， 因 为 没有 这 些 值 的 历史 记录 。 这 就 是 临时 数据 的 特征 。 

华 昌 期 10/03 中 ， 记 录 的 变化 更 多 (为 了 简化 讨论 ， 我 们 假定 在 某 一 天 对 指定 记录 只 能 进 
行 一 次 修改 )。003 记 录 得 到 更 新 ，004 记 录 被 删除 。 注 意 ， 没 有 任何 记录 表明 004 记 录 曾 经 在 数 
据 库 中 保存 过 。 图 11-7 所 示 的 数据 处 理 方式 是 运作 系统 中 临时 数据 的 典型 特征 。 

2. 周期 数据 

数据 仓库 的 目标 之 一 就 是 维护 关键 事件 的 历史 数据 或 针对 诸如 销售 额 的 特殊 变量 创建 时 间 
序列 。 为 实现 这 一 目标 ， 就 要 求 存储 周期 数据 而 不 是 临时 数据 。 图 11-9 和 图 11-8 使 用 的 是 同一 
张 数据 表 ， 只 不 过 是 作 了 一 些 修改 使 其 表示 周期 数据 。 图 11-9 作 了 如 下 修改 : 

1) 表 X 中 新 增 了 两 列 。 

a) 名 为 Date 的 列 代表 时 间 惟 ， 它 存储 表 记 录 更 改 的 最 近日 期 。 
b) 名 为 Action 的 列 记录 数据 更 改 的 类 型 ， 该 属性 可 以 取 的 值 包括 C ( Create )、 

U (Update) 和 D (Delete )。 

2) 一 旦 一 条 记录 存 人 表 X， 这 条 记录 就 不 会 改变 。 在 改变 一 条 记录 时 ， 前 像 和 后 像 都 会 存 
人 数据 表 。 尽 管 一 条 记录 可 以 在 过 辑 上 被 删除 ， 但 是 被 删除 记录 的 历史 版 本 仍然 保存 在 数据 库 
中 ， 保 存 的 时 间 取 决 于 趋势 分 析 的 需要 (至 少 五 个 季度 )。 

现在 让 我 们 来 分 析 图 11-9 所 发 生 的 一 组 动作 。 假 定 所 有 的 四 条 记录 都 在 10/01 创 建 ， 如 第 一 
个 表 所 示 。 

人 在 第 二 个 表 中 〈10/02)，002 记 录 和 004 记 录 得 到 更 新 。 此 时 ， 表 X 中 既 包 含 旧 的 记录 版 本 
(10/01) 也 包含 新 的 记录 版 本 (10/02)。 同 时 还 增加 了 一 条 在 10/02 产 生 的 记录 005。 

第 二 张 表 (10/03) 对 003 记 录 进 行 了 更 新 ， 也 保留 了 旧 记 录 和 新 记录 。004 记 录 在 这 张 表 
中 被 删除 了 ， 那 么 此 时 表 X 包 含 三 个 版 本 的 004 记 录 : 初始 版 本 (10/01)、 更 新 版 本 (10/02) 
与 删除 版 本 (10/03)。004 记 录 的 最 后 一 行 中 的 DD 指明 这 条 记录 已 经 在 逻辑 上 删除 了 ， 因 此 对 于 
用 户 或 他 们 的 应 用 程序 而 言 ， 该 记录 不 可 访问 。 

经 过 对 图 11-9 的 研究 分 析 ， 就 可 以 明白 为 什么 数据 仓库 的 增长 如 此 迅速 。 存 储 周期 数据 需 
要 大 量 存储 空间 。 因 此 ， 得 出 一 个 必然 结论 : 用 户 必 须 非常 仔细 地 选择 需要 以 这 种 方式 进行 处 
理 的 关键 数据 。 


11.6 调和 数据 层 


如 图 11-6 所 示 ， 调 和 数据 (reconciled data) 意 指 与 运作 数据 存储 和 企业 数据 仓库 相关 联 的 
数据 层 。IBM 在 1993 年 的 一 篇 论文 中 使 用 了 这 个 术语 ， 用 来 描述 数据 仓库 体系 结构 。 尽 管 该 术 
语 并 没有 被 广泛 使 用 ,但 是 它 准确 地 描述 了 出 现在 企业 数据 仓库 中 数据 的 本 质 以 及 获得 它们 的 
方式 。 通常， 调和 数据 是 作为 ETL 过 程 的 结果 被 提 及 。EDW 或 ODS 通 常 是 规范 化 的 关系 数据 
库 ， 因 为 它们 都 需要 一 定 的 灵活 性 来 支持 各 种 各 样 的 决策 需求 。 
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11.6.1 进行 ETL 之 后 的 数据 特征 

抽取 、 转 换 和 装载 都 是 为 了 给 用 于 决策 支持 的 数据 提供 一 个 惟一 的 权威 来 源 。 理 想 情 况 
下 ， 这 个 数据 层 是 详细 的 、 历 史 的 、 规 范 化 的 、 全 面 的 、 及 时 的 ， 并 且 其 质量 也 能 够 得 到 良 
好 的 控制 。 

1) 详细 的 数据 是 详细 的 (而 不 是 概要 的 ) ， 可 以 为 不 同 的 用 户 群 体 提供 最 大 的 灵活 性 ， 以 
构建 符合 用 户 需 求 的 数据 。 

2) 历史 的 数据 是 周期 的 (或 者 说 是 某 个 时 间 点 上 的 )， 因 此 可 以 提供 历史 视图 。 

3) 规范 化 的 ”数据 是 完全 规范 化 的 ( 即 ， 符 合 第 二 范式 或 更 高 级 别 的 范式 ， 我 们 在 第 5 章 
里 已 经 讨论 过 规范 化 问题 ) 。 规 范 化 数据 比 非 规范 化 数据 提供 更 大 的 完整 性 和 灵活 性 。 由 于 通 
常情 况 下 使 用 批 处 理 方法 周期 性 地 访问 调和 数据 , 所 以 非 规 范 化 不 是 提高 性 能 所 必须 的 。 不 过 ， 
后 面 我 们 将 会 看 到 ， 一 些 流行 的 数据 仓库 的 数据 结构 就 是 非 规范 化 的 。 

4) 全 面 的 调和 数据 反映 企业 级 视图 ， 它 的 设计 与 企业 数据 模型 一 致 。 

5) 及 时 的 ”除了 主动 仓库 以 外 ， 数 据 不 必 是 实时 的 。 然 而 ， 数 据 必须 足够 新 ， 以 便 作出 及 
时 的 决策 反应 。 

6) 良好 的 质量 控制 ”调和 数据 不 能 有 任何 质量 和 完整 性 问题 ， 以 便 在 数据 集 市 中 汇总 并 用 
于 决策 制定 。 

注意 ， 调 和 数据 的 这 些 特征 与 衍生 出 它们 的 典型 的 运作 数据 的 特征 大 相 径 庭 。 运 作 数 据 也 
是 详细 的 ， 但 是 在 其 他 四 个 方面 存在 很 大 差异 : 

1) 运作 数据 是 临时 的 ， 而 不 是 历史 的 。 

2) 运作 数据 不 是 规范 化 的 。 就 其 核心 而 言 ， 运 作 数据 可 能 从 来 不 会 被 规范 化 ， 甚 至 出 于 性 
能 券 虑 而 进行 非 规范 化 。 

3) 运作 数据 通常 为 了 某 个 特定 的 应 用 而 限制 于 一 定 范围 内 ， 因 此 它们 不 会 是 全 面 的 。 

4) 运作 数据 的 质量 一 般 不 太 好 ， 可 能 存在 各 种 不 一 致 错误 和 其 他 错误 。 

数据 调和 过 程 负责 把 运作 数据 转换 成 调和 数据 。 由 于 这 两 种 数据 之 间 存 在 巨大 差异 ,因此 ， 
明确 的 数据 调和 在 构建 数据 仓库 时 是 最 困难 也 是 技术 上 最 富有 挑战 性 的 一 个 部 分 。 值 得 庆幸 的 
是 ， 已 经 有 几 种 完善 的 软件 产品 可 以 辅助 完成 数据 调和 过 程 。 

11.6.2 ETL 过 程 

在 填充 EDW 的 过 程 中 ， 数 据 调 和 在 以 下 两 个 阶段 发 生 : 

1) 在 创建 EDW 之 初 的 初始 装载 阶段 。 

2) 为 了 保证 EDW 内 容 最 新 或 对 其 进行 扩展 ， 而 随后 进行 的 更 新 (一般 是 定期 进行 )。 

数据 调和 过 程 如 图 11-10 所 示 ， 其 中 包括 四 个 步骤 : 获取 、 清 洗 、 转 换 、 装 载 和 索引 。 实 
际 上 ， 这 些 步骤 可 以 用 不 同方 式 进行 合并 。 例 如 ， 数据 获取 和 清洗 可 以 合并 成 一 个 过 程 ， 或 者 
将 清洗 和 转换 合并 为 一 个 过 程 。 下 面 首先 讨论 获取 、 清 洗 、 装 载 和 索引 ， 然 后 彻底 讨论 转换 。 

1. 抽取 

从 源 文件 和 数据 库 中 获取 用 来 填充 EDW 的 相关 数据 的 过 程 叫 做 抽取 。 一 般 来 说 ， 并 不 需 
要 所 有 运作 系统 中 的 数据 ， 所 需要 的 只 是 其 中 的 一 个 子 集 。 在 对 源 系统 和 目标 系统 详尽 分 析 的 
基础 上 方 能 抽取 数据 子 集 ， 这 个 工作 最 好 由 数据 管理 部 门 领导 的 小 组 来 完成 ， 该 小 组 由 终端 用 
户 和 数据 仓库 专业 人 员 组 成 。 

数据 抽取 分 为 两 种 类 型 : 静态 抽取 和 增 量 抽取 。 静 态 抽取 用 于 初始 填充 数据 仓库 ， 而 增 量 
抽取 则 用 于 数据 仓库 的 日 常 维护 。 

静态 抽取 (static extraction ) 是 一 种 获取 所 需要 的 源 数据 在 某 个 时 间 点 的 快照 的 方法 。 源 
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数据 视图 被 创建 时 是 独立 于 时 间 的 。 

增 量 抽取 (incremental extraction) 只 获取 自 上 次 抽取 后 源 数据 中 发 生变 化 的 部 分 。 最 常见 
的 方法 就 是 日 志 获 取 。 因 为 数据 库 日 志 中 记载 的 是 数据 库 记 录 最 近 变 化 的 后 象 (参见 图 11-7 )， 
所 以 日 志 获 取 就 是 从 日 志 中 选择 自 上 次 抽取 后 所 记载 的 后 象 。 








分 级 区 





装载 和 
索引 





获取 /抽取 







数据 调和 





人 本 
放下 企业 数据 仓库 或 运 
运作 系统 作 数 据 存储 


图 11-10 数据 调和 的 步骤 


English (1999) 和 White (2000) 详细 地 提出 了 使 记录 系统 和 其 他 源 数据 具有 抽取 到 分 级 
区 域 资格 的 必要 步骤 。 主 要 标准 是 源 系统 数据 的 质量 。 主 要 依据 如 下 几 点 判断 质量 : 

* 数据 命名 的 清晰 度 、 便 于 仓库 设计 者 确切 知道 源 系统 中 都 存在 哪些 数据 。 

“ 源 系统 执行 的 业务 规则 的 完备 性 和 准确 性 ， 这 一 点 直接 影响 数据 的 准确 度 。 同 时 ， 源 系 

统 的 业务 规则 应 与 数据 仓库 中 使 用 的 规则 相 匹配 。 

* 数据 格式 〈 跨 数据 源 的 公共 格式 有 助 干 匹配 相关 数据 )。 

与 源 系 统 的 所 有 者 达成 协议 也 很 重要 ， 这 样 ， 他 们 就 会 在 源 系 统 的 元 数据 发 生变 化 时 通知 
数据 仓库 管理 员 。 由 于 事务 系统 会 频繁 更 改 以 满足 新 的 业务 以 及 利用 新 的 、 更 好 的 软 醒 件 技术 ， 
因此 ， 如 何 管理 源 系 统 中 的 更 改 是 抽取 过 程 所 面临 的 最 大 挑战 之 一 。- 旦 源 系 统 发 生变 化 ， 数 
据 质量 以 及 抽取 和 转换 数据 过 程 就 需要 进行 重新 评估 。 这 些 过 程 将 源 系统 的 数据 映射 为 目标 数 
据 仓 库 (或 数据 集 市 ) 的 数据 。 映 射 表 明 数 据 仓库 的 各 个 数据 是 由 哪个 源 系 统 的 哪个 数据 导出 
来 的 ， 而 转换 规则 (在 其 他 的 小 节 中 讨论 ) 则 描述 如 何 进行 导出 。 对 于 定制 构建 的 客户 源 系统 ， 
数据 仓库 管理 负 必 须 开发 定制 的 映射 和 抽取 例 程 。 而 一 些 打 包 的 应 用 软件 (比如 ERP 系 统 ) 可 
以 购买 预先 定义 的 映射 模板 。 

可 以 采用 与 源 系 统 相关 的 工具 (如 数据 导出 工具 ) 编写 抽取 例 程 。 通 常 ， 用 一 种 中 性 的 数 
据 格式 来 抽取 数据 ， 如 采用 逗号 分 隔 的 ANSI 格 式 。 有 时 ， 也 使 用 SQL 命令 SELECT.INTO 来 创 
建 载 人 分 级 区 的 表 。 

一 旦 选 定数 据 源 并 编写 了 抽取 例 程 ， 就 可 以 把 数据 转移 到 分 级 区 ， 在 那里 开始 清洗 过 程 。 

2. 清 洗 

运作 系统 中 数据 的 质量 通常 很 差 ， 其 中 一 些 典 型 的 数据 错误 和 数据 不 一 至 包括 : 

1) 名 字 和 地 址 拼写 错误 。 

2) 不 可 能 的 或 错误 的 出 生日 期 ， 

3) 某 些 字段 的 使 用 与 最 初 的 使 用 目的 不 符合 。 
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4) 地 址 和 邮政 编码 错误 匹配 。 

5) 缺失 数据 。 

6) 重复 的 数据 。 

7) 源 数据 之 间 的 不 一 臻 (如 ， 不同 的 地 址 )。 

这 里 可 以 再 举 出 一 些 错误 的 例子 。 比 如 ， 在 顾客 文件 中 ， 顾 客 的 名 字 经 常 作为 主键 或 检索 
的 关键 字 。 然 而 ， 这 些 名 字 却 经 常 被 拼 错 或 在 不 同 的 文件 中 以 不 同方 式 拼写 。 例 如 ，“The 
Coca-Cola Company” 是 可 申 可 乐 公司 名 字 的 正确 拼 法 ， 但 在 顾客 记录 中 可 能 会 写成 “Coca- 
Cola”"、“Coca Cola”、“TCCC” 等 各 种 不 同 的 方式 。 研 究 表明 ， 仅 “McDonald's” 一 词 就 可 能 
有 100 种 不 同 的 拼写 方式 ! 

另外 一 种 数据 污染 就 是 某 个 字段 的 使 用 与 最 初 的 目的 不 符 。 例 如 ， 在 某 银 行 数据 库 中 ， 设 
计 了 一 个 字段 用 来 记录 电话 号 码 。 然 而 ， 某 个 部 门 经 理 并 不 需要 这 个 字段 的 内 容 ， 所 以 取 而 代 
之 存 和 人 的 是 利率 。 另 外 一 个 例子 更 加 奇怪 ， 是 由 一 家 著名 的 英国 银行 报道 的 : 数据 清洗 程序 在 
文件 里 发 现 了 一 个 顾客 ， 他 的 职业 栏 中 填写 着 “泰坦 尼克 上 的 乘务 员 ”! (Devlin，1997 ) 

你 可 能 想 知道 为 什么 运作 数据 中 的 错误 如 此 普遍 。 运 作 数据 的 质量 在 很 大 程度 上 由 负责 收 
集 它们 的 组 织 对 数据 的 估计 所 决定 。 但 是 ， 数 据 收 集 组 织 经 常 对 一 些 重要 数据 估计 过 低 ， 而 这 
些 数 据 的 准确 性 对 于 下 游 的 应 用 系统 (如 数据 仓库 ) 则 是 非常 关键 的 。 

在 错误 经 常 发 生 的 前 提 下 ， 最 坏 的 情形 就 是 公司 仅仅 把 运作 数据 拷贝 到 数据 仓库 中 ， 而 较 
好 的 情形 是 利用 一 种 叫做 数据 清洗 的 技术 来 改善 源 数据 的 质量 。 数 据 清洗 (data scrubbing， 也 
称 为 data cleansing ) 就 是 在 转换 数据 并 将 其 载 人 数据 仓库 之 前 ， 使 用 模式 识别 和 其 他 技术 提升 
原始 数据 质量 的 一 种 技术 。 

成 功 的 数据 仓库 要 求实 现 一 个 符合 全 面 质量 管理 (Total Quality Management，TQM) 的 正 
式 程序 。TQM 和 致力 于 防止 错误 ， 而 不 是 纠正 错误 。 尽 管 数据 清洗 有 助 于 改善 数据 质量 ， 但 它 
并 不 是 一 个 解决 数据 质量 问题 的 长 期 方案 。English ( 1999) 对 在 数据 管理 中 应 用 TQM 有 精妙 
的 论述 。 

所 需 的 数据 清洗 类 型 取决 于 源 系统 数据 的 质量 。 除 了 能 解决 前 面 所 提 到 的 问题 外 ， 清 洗 还 
可 以 完成 如 下 一 些 任务 : 

。 解码 数据 ， 使 数据 仓库 应 用 可 以 理解 这 些 数 据 。 

* 重新 格式 化 和 改变 数据 类 型 并 执行 其 他 函数 ， 把 来 自 每 个 源 系 统 的 数据 变 成 数据 仓库 的 

标准 格式 ， 为 转换 做 好 准备 。 

。 加 上 时 间 惟 以 区 分 相同 属性 在 不 同时 间 的 值 。 

* 在 不 同 度量 单位 之 间 进 行 转换 。 

* 为 表 的 每 一 行 产 生 主键 (在 本 章 后 面 ， 我 们 将 讨论 数据 仓库 中 表 的 主键 和 外 键 的 形成 )。 

* 把 不 同 的 抽取 内 容 匹 配 和 融合 ， 构 成 一 张 表 或 一 个 文件 ， 并 把 数据 一 一 匹配 到 这 张 表 的 

相应 行 中 ( 当 不 同 的 源 系统 采用 不 同 的 键 ， 或 者 不 同 的 源 系 统 命名 惯例 不 同 以 及 源 系 统 

中 的 数据 包含 错误 时 ， 这 是 一 个 非常 困难 的 过 程 )。 

“ 在 日 志 中 记录 所 检测 到 的 错误 ， 更 正 那 些 错误 ， 并 再 次 处 理 已 修正 的 数据 而 不 需要 创建 

元 余 项 。 

* 找寻 缺失 的 数据 ， 保 证 接 下 来 要 进行 的 装载 过 程 数据 完整 。 

对 不 同 数据 源 的 处 理 顺 序 也 是 要 考虑 的 一 个 方面 。 例如 ， 先 处 理 来 自 销售 系统 的 顾客 数据 ， 
然后 新 的 来 自 于 外 部 系统 的 顾客 统计 数据 就 能 够 与 之 匹配 。 

一 旦 分 级 区 的 数据 清洗 完毕 ， 则 进行 转换 的 数据 也 就 准备 好 了 。 在 我 们 详细 讨论 转换 过 程 
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之 前 ， 首 先 简要 地 回顾 一 下 把 数据 载 入 数据 仓库 或 数据 集 市 的 过 程 。 

3. 装载 和 索引 

填充 EDW 的 最 后 一 步 就 是 把 选择 好 的 数据 装 入 日 标 数 据 仓 库 并 创建 必要 的 索引 。 装 载 数 
据 到 目标 EDW 有 两 种 基本 模式 : 删 新 模式 和 更 新 模式 。 

刷新 模式 (refresh mode) 是 一 种 应 用 定期 重 写 目 标 数据 的 填充 数据 仓库 的 方法 。 也 就 是 
说 ， 起 初 目标 数据 被 写 人 人 仓库， 随后 定期 重 写 仓库 数据 ， 替 换 先 前 的 内 容 。 这 种 模式 如 今 已 经 
不 大 流行 了 。 

更 新 模式 (update mode) 是 一 种 只 向 数据 仓库 中 写 入 源 系统 数据 变化 的 装载 方法 。 为 了 
支持 仓库 数据 的 周期 性 本 质 ， 新 记录 往往 被 写 入 数据 仓库 ， 而 不 需要 覆盖 或 删除 先前 的 记录 
(参见 图 11-9 )。 

像 我 们 所 期 望 的 那样 ， 刷 新 模式 通常 用 于 在 数据 仓库 创建 时 填充 仓库 ， 更 新 模式 则 是 用 于 
目标 仓库 的 日 常 维护 。 刷 新 模式 与 静态 数据 捕获 联合 使 用 ， 而 更 新 模式 与 增 量 数据 捕获 联合 
使 用 。 

无 论 是 剧 新 模式 还 是 更 新 模式 ， 都 必须 创建 和 维护 用 来 管理 仓库 数据 的 索引 。 数 据 仓 库 环 
境 经 常 采用 一 种 叫做 位 映射 索引 (bit-mapped indexing) 的 索引 类 型 (参见 第 6 章 )。 本 章 后 面 
讲述 针对 数据 仓库 和 数据 集 市 的 数据 库 设 计时 ， 还 会 讨论 索引 问题 。 

基于 广 为 认 知 并 且 非 常 成 功 的 Wal-Mart 公 司 的 数据 仓库 ，Westernman (2001) 讨论 了 在 
决定 以 怎样 的 频率 更 新 数据 仓库 时 应 考虑 的 因素 。 他 的 原则 是 根据 实际 应 用 更 新 数据 仓库 。 
更 新 不 够 频繁 会 导致 装载 数量 过 大 ， 而 且 还 会 导致 用 户 等 待 新 数据 。 另 一 方面 ， 几 平实 时 的 
装载 虽然 对 于 主动 数据 仓库 非常 必要 ， 但 对 于 大 多 数 数据 挖掘 和 分 析 应 用 系统 而 言 并 不 必要 ， 
并 且 可 能 会 导致 效率 低下 。 对 于 大 多 数组 织 而 言 ，Westerman 建 议 每 日 更 新 就 足够 了 。 不 过 ， 
每 日 更 新 不 能 对 某 些 条 件 的 变化 作出 迅速 反应 ， 例 如 改变 某 些 沿 销 产品 的 定价 或 购买 订单 。 
Wal-Mart 实 行 的 是 持续 更 新 数据 仓库 ， 由 于 他 们 采用 海量 并 行 的 数据 仓库 技术 ， 所 以 这 种 方法 
是 实际 可 行 的 。 

把 数据 载 人 仓库 通常 意味 着 向 仓库 中 的 表 追 加 新 的 行 ， 也 可 能 意味 着 用 新 数据 更 新 现 有 行 
(例如 ， 从 额外 的 数据 源 获 取 数 据 填充 仓库 表 里 缺 失 的 值 )， 还 可 能 意味 着 从 仓库 里 清除 指定 数 
据 ， 这 些 数据 可 能 因为 时 间 过 长 而 废弃 ， 或 者 在 上 一 次 装载 操作 时 没有 正确 装载 。 数 据 可 以 利 
用 以 下 方法 从 分 级 区 栽 人 仓库 : 

。SQL 命令 (例如 INSERT 或 UPDATE ) 。 

“由 数据 仓库 或 第 三 方 提供 的 特殊 装载 程序 。 

*。 由 仓库 管理 员 编写 的 定制 例 程 。 

上 述 任何 一 种 方法 都 要 求 装载 例 程 不 仅 能 够 更 新 数据 仓库 ， 而 且 还 要 产生 错误 报告 来 显示 
被 拒绝 的 数据 〈 例 如 ， 党 试 追加 键 值 重 复 的 行 ， 或 者 更 新 仓库 表 中 根本 不 存在 的 行 )。 

装载 程序 能 够 以 批 处 理 模式 或 连续 模式 进行 工作 。 利 用 装载 程序 ， 用 户 可 以 通过 编写 脚本 
来 定义 分 级 区 中 数据 的 格式 ， 以 及 分 级 区 中 的 数据 分 别 与 数据 仓库 中 的 哪个 字段 对 应 。 装 载 程 
序 可 以 将 分 级 区 某 个 字段 中 的 数据 类 型 转换 为 仓库 中 目标 字段 的 数据 类 型 ， 还 可 以 执行 IF- 
THEN-ELSE 逆 辑 处 理 不 同 格式 的 分 级 区 数据 ， 或 者 指导 将 数据 输入 数据 仓库 的 不 同 表 里 。 程 
序 还 可 以 在 数据 装载 (刷新 模式 ) 或 追加 新 行 (更 新 模式 ) 之 前 清理 仓库 表 中 的 所 有 数据 
(DROP TABLE)。 装 载 程序 还 能 够 将 输入 数据 分 类 ， 以 便于 表 的 行 在 被 更 新 之 前 先 被 追加 。 此 
外 ， 装 载 程序 可 以 根据 需要 运行 任何 DBMS 存 储 进程 ， 理 想 情况 下 ， 还 可 以 运行 所 有 DBMS 的 
并 发 控制 ; 一 旦 在 装载 过 程 中 遇 到 DBMS 故 障 ， 重 启 和 恢复 将 会 奏效 。 因为 执行 装载 过 程 会 非 
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常 耗 时 ， 所 以 如 果 DBMS 在 装载 过 程 中 发 生 崩 涡 ， 则 装载 能 够 从 检查 点 开始 继续 装载 是 极为 重 
要 的 。 本 书 第 12 章 将 完整 地 讨论 数据 库 的 重启 和 恢复 。 


11.7 数据 转换 


数据 转换 (data transformation ) 是 数据 调和 过 程 的 中 心 ， 它 是 数据 调和 的 组 成 部 分 ， 目 
的 是 把 源 运作 系统 的 数据 格式 转换 为 EDW 的 数据 格式 。 数 据 转换 接受 来 源 于 数据 捕获 组 件 的 
数据 (在 数据 清洗 之 后 )， 然 后 把 数据 映射 为 调和 数据 层 的 格式 ， 再 将 数据 传递 至 装载 和 素 
引 组 件 。 

数据 转换 的 范围 覆盖 从 数据 格式 (或 表示 ) 的 简单 变化 到 实现 高 度 复杂 的 数据 集成 。 下 面 
列举 了 说 明 这 个 范围 的 三 个 例子 : 

1) 一 位 推销 员 要 求 从 主机 数据 库 中 把 顾客 数据 下 载 到 自己 的 笔记 本 电脑 中 ,在 这 种 情况 下 ， 
所 需要 的 转换 仅仅 是 将 EBCDIC 型 数据 转换 为 ASCII 表 示 ， 借 助 商业 现 用 软件 可 以 很 容易 地 完 
成 这 种 转换 。 

2) 一 家 制造 公司 的 产品 数据 存储 在 三 个 不 同 的 遗留 系统 中 ， 这 三 个 系统 分 别 为 制造 系统 、 
营销 系统 和 工程 应 用 系统 。 公 司 需 要 为 这 些 产品 数据 开发 一 个 联合 视图 。 数 据 转换 涉及 几 个 不 
同 的 功能 ， 共 中 包括 解决 不 同 的 键 结构 问题 ， 转 换 为 一 组 公共 编码 ， 集 成 来 自 不 同 源 的 数据 。 
这 些 功 能 非常 直观 ， 可 以 直接 用 标准 的 、 带 有 图 形 界面 的 商业 软件 包 来 实现 。 

3) 一 家 大 型 的 健康 医疗 组 织 管理 着 一 组 地 理 上 分 散 的 医院 、 诊 所 及 其 他 诊疗 中 心 。 因 为 这 
些 单位 是 通过 收购 而 归 入 这 家 医疗 组 织 的 ， 所 以 其 中 的 数据 是 异 构 和 不 一 致 的 。 出 于 许多 重要 
原因 ， 该 组 织 需要 开发 一 个 数据 仓库 以 提供 一 个 企业 级 整体 视图 。 这 就 要 用 到 如 下 描述 的 所 有 
转换 因数 ， 其 中 包括 一 些 定制 的 软件 开发 在 内 。 

数据 清洗 所 执行 的 功能 和 数据 转换 所 执行 的 功能 有 可 能 发 生 混淆 。 一 般 而 言 ， 数 据 清洗 的 
目标 是 校正 源 数据 中 数据 值 的 错误 ， 而 数据 转换 的 目标 是 把 源 数 据 的 格式 转换 为 目标 系统 的 格 
式 。 注 意 ， 在 数据 转换 前 必须 进行 数据 清洗 ， 因 为 如 果 在 转换 前 数据 就 有 错误 的 话 ， 那 么 在 数 
据 转 换 后 错误 仍然 存在 。 

11.7.1 数据 转换 函数 

数据 转换 包含 多 种 不 同 的 函数 。 这 些 函 数 从 广义 上 可 以 划分 为 两 类 : 记录 级 函数 和 字段 级 
消 数 。 在 大 多 数 数据 仓库 应 用 系统 中 ， 可 能 需要 联合 应 用 其 中 一 些 甚至 是 所 有 的 函数 。 

1. 记录 级 函数 

操作 一 组 记录 (如 文件 和 表 ) 的 最 为 重要 的 记录 级 函数 包括 选择 、 联 结 、 规 范 化 和 聚合 。 

选择 (selection ， 也 叫做 subsetting ) 就 是 根据 预先 定义 的 标准 划分 数据 的 过 程 。 对 数据 仓 
库 应 用 而 言 ， 选 择 就 是 从 将 要 填充 数据 仓库 的 源 系统 中 抽取 相关 数据 的 过 程 中 。 事 实 上 ， 选 择 
是 前 面 所 讨论 的 捕获 函数 的 一 部 分 。 

当 源 数据 是 关系 数据 时 ，SQL 的 SELECT 语 句 可 以 用 于 选择 (详情 参见 第 7 意 )。 例 如 ， 从 
上 一 次 捕获 时 已 经 创建 的 数据 库 日 志 中 选择 后 象 就 可 以 实现 增 量 捕获 。 典 型 的 后 象 如 图 11-7 所 
示 。 假 定 该 应 用 的 后 象 储存 在 一 个 名 为 ACCOUNT_HISTORY 的 表 中 ， 那 么 在 12/31/2001 之 后 
所 创建 的 后 象 就 可 以 用 如 下 语句 来 选择 : 

SELECT * 


FROM ACCOUNT HISTORY 
WHERE Create Date>12/31/2001; 


联结 (joining) 把 不 同 来 源 的 数据 合并 为 一 张 表 或 视图 。 联 结 数据 在 数据 仓库 应 用 中 是 一 
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个 重要 的 功能 ， 因 为 合并 来 自 不 同 源 的 数据 是 非常 必要 的 。 例 如 ， 一 家 保险 公司 的 客户 数据 可 
能 分 布 在 许多 不 同 的 文件 或 数据 库 中 。 当 源 数 据 是 关系 数据 时 ，SQL 语 句 可 以 用 来 执行 联结 操 
作 (详情 参见 第 7 章 ) 。 

由 于 存在 以 下 因素 ， 联 结 有 时 非常 复杂 : 

1) 源 数据 通常 不 是 关系 型 数据 ， 在 这 种 情况 下 ， 就 不 能 使 用 SQL 语句 了 了， 取而代之 的 是 必 
须 编 写 过 程 语言 语句 。 

2) 即使 是 关系 型 数据 ， 欲 联结 的 表 的 主键 通常 来 自 不 同 的 域 (例如 ， 工 程 零 件 编号 与 目录 
编号 )。 这 些 键 必须 在 执行 SQL 联结 之 前 进行 调和 。 

3) 源 数 据 可 能 包含 错误 ， 这 使 得 联结 操作 也 可 能 产生 错误 。 

规范 化 (normalization) 过 程 可 以 分 解 不 规则 的 关系 ， 以 产生 较 小 的 、 结 构 良 好 的 关系 
(详情 参见 第 5 章 )。 正 如 前 面 所 指出 的 ， 运 作 系 统 中 的 源 数据 通常 不 是 规范 化 的 (或 者 一 点 也 
不 规范 )。 因 此 ， 这 些 数据 必须 在 数据 转换 中 被 规范 化 。 

聚合 (aggregation) 是 将 数据 从 细节 级 转换 到 汇总 级 的 过 程 。 例 如 ， 在 零售 业务 中 ， 可 以 
根据 商场 、 产 品 、 日 期 等 汇总 单个 销售 事务 以 产生 总 的 销售 统计 。 因 为 在 我 们 的 模型 中 ， 
EDW 只 包含 详细 数据 ， 聚 合 一 般 与 这 个 部 分 无 关 。 然 而 ， 在 填充 数据 集 市 时 ， 育 合 非常 重要 ， 
这 一 点 会 在 下 面 进行 解释 。 

因为 可 以 用 SQL 语句 实现 选择 、 联 结 和 聚合 ， 所 以 一 些 数据 仓库 专家 主张 转换 应 该 在 运作 
数据 存储 或 数据 仓库 里 进行 。 

2. 字段 级 函数 

字段 级 浮 数 将 源 记录 中 给 定格 式 的 数据 转换 为 目标 记录 中 不 同 格式 的 数据 。 字 段 级 函数 分 
为 两 种 : 单字 段 和 多 字段 。 

单字 段 (single-field) 转换 将 一 个 源 字段 数据 转换 为 一 个 目标 字段 数据 。 图 11-11a 是 这 种 
类 型 转换 的 基本 表示 (由 图 表 中 的 字母 T 指 明 )。 例 如 ， 把 某 个 度量 从 英制 表示 转换 为 公制 表示 
就 是 单字 段 转换 。 

如 图 11-11b 和 11-11c 所 示 ， 有 两 种 基本 方法 可 以 实现 单字 段 转换 ， 即 算法 和 表 查 找 。 算 法 
转换 是 借助 于 公式 或 逻辑 表达 式 来 实现 的 。 图 11-11b 显 示 了 利用 公式 将 华氏 温度 转换 为 摄氏 温 
度 的 过 程 。 当 简单 的 算法 不 能 奏效 时 ， 可 以 使 用 查找 表 的 方法 。 图 11-11c 显 示 了 使 用 查找 表 将 
状态 代码 转换 为 状态 名 的 过 程 (这 种 类 型 的 转换 在 数据 仓库 应 用 系统 中 非常 普遍 )。 

多 字段 (multifield) 转换 把 一 个 或 多 个 源 字 段 中 的 数据 转换 为 一 个 或 多 个 目标 字段 的 数据 。 
这 种 类 型 的 转换 在 数据 仓库 应 用 中 也 很 普遍 。 图 11-12 展 示 了 两 个 多 字段 转换 的 例子 。 

图 11-12a 是 一 个 多 对 一 的 转换 的 例子 (在 本 例 中 ， 将 两 个 源 字段 映射 到 一 个 目标 字段 上 )。 
在 源 记 录 中 ， 员 工 姓名 和 电话 号 码 共同 作为 主键 。 这 种 联合 主键 比较 笨拙， 而 且 可 能 发 生 不 能 
惟一 标识 某 个 人 的 情况 。 因 此 ， 在 创建 目标 记录 时 ， 联 合 主键 就 被 映射 到 惟一 的 员工 ID 字段 上 
(Emp_ID )。 此 时 ， 必 须 创 建 查找 表 以 支持 该 转 换 。 同 时 ， 还 可 以 使 用 数据 清洗 程序 确定 源 数 
据 中 的 重复 部 分 。 

图 11-12b 是 一 个 一 对 多 的 转换 的 例子 (在 本 例 中 ， 将 一 个 源 字段 转换 为 两 个 目标 字段 ) 。 
在 源 记录 中 ， 用 产品 代码 对 品牌 名 和 产品 名 编码 (这 种 编码 方法 常常 用 于 运作 数据 )。 然 而 ， 
在 日 标记 录 中 ， 需 要 完整 地 描述 产品 和 品牌 名 。 此 时 ， 同 样 需要 采用 查找 表 来 达到 这 一 目的 。 

3. 更 复杂 的 转换 

在 图 11-12 中 ， 多 字段 转换 只 涉及 一 个 源 记 录 和 一 个 目标 记录 的 情况 。 但 是 ， 多 字段 转换 
常常 涉及 多 个 源 记录 和 /或 多 个 目标 记录 。 最 复杂 的 情形 下 ， 这 些 记 录 其 至 来 自 于 不 同 的 运作 
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系统 和 不 同 的 时 区 (Devlin，1997)。 





关键 字 x 


目标 记录 
EEE 


a) 基本 表示 
源 记 录 


NAV crarean 


目标 记录 | : 


b) 算法 转换 


















| 
WW 
Er 
目标 记录 
中 表 查 找 * 
图 11-11 单字 段 转换 


11.7.2 支持 数据 调和 的 工具 

前 面 已 经 介绍 过 ， 数 据 调 和 是 一 个 特别 复杂 和 具有 挑战 性 的 过 程 。 必 须 开 发 (或 者 获取 ) 
各 种 紧密 集成 的 软件 应 用 来 支持 这 个 过 程 。 值 得 庆幸 的 是 ， 已 经 有 许多 功能 强大 的 软件 工具 可 
以 帮助 组 织 开发 这 些 应 用 系统 。 本 节 描 述 三 种 这 样 的 工具 : 数据 质量 、 数 据 转化 和 数据 清洗 
(如 果 想 了 解 更 多 情况 ， 请 参见 Williams ，1997)。 表 11-3 对 这 三 种 工具 作 了 总 结 。 
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产 丰 名 称 公 本 描述 

WizRules WizSoft, Inc. 规则 发 现 
Www.wizsoft .com 

Extract Evolutionary Technologies International 。” 抽取、 转换 、 装 载 和 索引 

” www.evtech.com 

InfoRefiner © Computer Associates 抽取 、 转 换 、 装 载 和 索引 
www.ca.com 

DataBridge © Taurus Software, Inc. 抽取 、 转 换 、 装 载 和 索引 
www.taurus.com 

Genio Suite “Hummingbird, Ltd. 抽取 、 转 换 、 浓 缩 、 装 栽 
www.hummingbird.com 

Power Mart Informatica 抽取 、 转 换 、 装 载 和 索引 
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( 续 ) 
产品 名 称 公 上品 描述 
Trillium Harte-Hanks 质量 分 析 和 和 数据 清洗 
www.harte-hanks .com 
Centric Firstlogic 质 葛 分 析 和 数据 清洗 (参见 Information Quality Demo) 
www firstlogic .com 
Integrity Vality Technology. Inc. 用 于 质量 分 析 和 数据 清洗 的 产品 系列 


www.vality.com 


1. 数据 质量 工具 

这 些 工 具 的 作用 是 评估 现 有 系统 数据 的 质量 , 并 且 将 结果 与 数据 仓库 的 要 求 相 比 较 。 所 以 ， 
在 仓库 开发 初期 , 这 些 工具 是 很 有 用 的 。 表 11-3 列 出 了 一 个 这 样 的 工具 一 一 WizRules ( WizSoft， 
Inc.)， 它 是 一 个 发 现 规则 的 工具 ， 通 过 搜索 现 有 表 中 的 记录 并 发 现 与 数据 相关 的 规则 。 例 如 ， 
可 能 有 这 样 一 条 规则 “如 果 Customer_Name 是 Able 或 Baker， 那 么 City 就 是 San Diego， 可 能 
是 0.95， 该 规则 在 50 条 记录 中 存在 ” 。 该 产品 也 可 以 确定 从 已 建立 规则 中 导出 的 记录 。 

2. 数据 转换 工具 

表 11-3 中 显示 的 另外 一 组 工具 是 数据 转换 工具 。 这 些 工 具 通 常 实现 三 种 主要 功能 : 抽取 、 
钱 换 、 装 载 和 索引 。 表 11-3 中 列 出 的 这 一 类 工具 包括 Extract ( Evolutionary Technologies 
International ) 、InfoRefiner (Computer Associates )、 DataBridge (Taurus Software, Inc.)、Genio 
Suite (Hummingbird Ltd.) 以 及 Power Mart ( Informatica ) 。 

这 一 类 工具 基本 上 是 程序 生成 工具 ， 它 们 作为 源 和 目标 文件 的 模式 (或 文件 描述 ) 输入 ， 
以 及 准备 用 作 数 据 转换 的 业务 规则 。 典 型 的 业务 规则 包括 公式 、 算 靶 和 查找 表 (如 图 11-11 所 
示 )。 接 着 ， 这 些 工具 产生 必要 的 程序 代码 ， 以 便 持续 执行 转换 功能 。 一 些 工具 (如 Genio 
MetaLink for SAP R/3， 它 是 Genio Suite 的 一 部 分 ) 提供 从 流行 的 应 用 软件 包 中 进行 抽取 和 转换 
的 模板 。 

3. 数据 清洗 工具 

最 后 一 类 包含 一 些 专用 于 数据 清洗 及 相关 功能 的 工具 。 例 如 ，Integrity (Vality 
Technology, Inc.)、Trillium (Harte-Hanks) 和 Centric (Firstlogic)。 它 们 用 来 进行 数据 质量 分 
析 、 数 据 清 洗 和 数据 重建 ( 即 在 数据 项 中 发 现 业 务 规则 和 联系 )。 


11.8 导出 数据 层 


现在 让 我 们 来 研究 一 下 导出 数据 层 ， 它 是 与 逻辑 或 物理 数据 集 市 相关 的 数据 层 (参见 图 
11-6)， 用 户 通常 与 这 一 层 进 行 交互 ， 以 进行 决策 。 理 想 情况 下 ， 应 首先 设计 调和 数据 层 作为 
导出 数据 层 的 基础 (无论 数据 集 市 是 依赖 的 、 独 立 的 还 是 虚拟 的 )。 在 本 节 中 ， 我 们 首先 讨论 
导出 数据 层 的 特征 以 及 从 调和 数据 层 中 导出 数据 的 方式 。 然 后 ， 介 绍 星 型 模式 (或 多 维 模型 )， 
它 是 目前 用 来 实现 导出 数据 层 的 一 种 常用 数据 模型 。 特 别 是 星 型 模式 用 来 对 关系 数据 模型 进行 
非 规范 化 。 虽 然 我 们 强调 导出 数据 层 可 以 采用 规范 化 关系 ， 但 是 大 多 数组 织 会 构建 很 多 数据 集 
市 ， 每 个 数据 集 市 都 是 围绕 着 一 个 用 户 组 感 兴趣 的 某 一 个 业务 目标 而 进行 优化 的 。 
11.8.1 导出 数据 的 特征 

以 前 ， 我 们 将 导出 数据 定义 如 下 : 为 终端 用 户 的 决策 支持 应 用 而 选择 、 格 式 化 且 聚 合 的 数 
据 。 如 图 11-6 所 示 ， 导 出 数据 的 源 是 前 面 讨论 过 的 调和 数据 。 数 据 集 市 里 的 导出 数据 一 般 是 出 
于 特定 用 户 群 (如 某 个 部 门 、 工 作 小 组 或 者 个 人 ) 的 需要 而 进行 优化 的 。 常 见 的 操作 方式 是 : 
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从 每 日 运行 的 EDW 中 选择 相关 数据 ， 根 据 需 要 将 其 格式 化 并 进行 诊 合 ， 然 后 向 目标 数据 集 市 
装载 和 索引 这 些 数据 。 
导出 数据 的 目标 与 调和 数据 的 目标 非常 不 同 。 导 出 数据 的 目标 包括 : 


1) 为 决策 支持 系统 提供 方便 。 
2) 为 预定 义 的 用 户 查 询 或 信息 请 求 提供 快速 响应 。 
3) 为 特定 的 目标 用 户 群 定制 数据 。 


4) 支持 即席 查询 和 数据 挖 据 应 用 。 

为 了 满足 上 述 需 要 ， 导 出 数据 通常 具有 如 下 特征 : 

1) 包含 详细 数据 和 统计 数据 。 

a. 详细 数据 通常 (但 并 不 一 直 ) 是 周期 性 的 。 也 就 是 说 ， 它 们 提供 历史 记录 。 
b. 聚合 数据 被 格式 化 为 能 够 对 预先 定义 (或 一 般 ) 的 查询 作出 快速 响应 。 

2) 数据 分 散在 部 门 服务 器 上 。 

3) 数据 集 市 最 经 常 使 用 的 数据 模型 是 星 型 模式 ， 星 型 模式 与 关系 模型 类 似 ， 有 时 也 使 用 专 
11.8.2 星 型 模式 

星 型 模式 (star schema) 是 一 种 简单 的 数据 库 设计 模式 (特别 适用 于 即席 查询 )。 在 这 种 
模式 下 ， 维 度数 据 (描述 通常 如 何 聚合 数据 ) 与 事实 或 事件 数据 相 分 离 (描述 单个 业务 事务 ) 
(Devlin，1997)， 另 外 一 个 经 常 使 用 的 名 字 是 多 维 模型 (Kimball，1996)。 尽 管 星 型 模式 非常 
适用 于 即席 查询 (和 其 他 形式 的 信息 处 理 )， 但 它 并 不 适合 联机 事务 处 理 ， 因 此 在 运作 系统 、 
运作 系统 存储 或 EDW 中 并 没有 被 广泛 采用 。 

1. 事实 表 和 维 表 

星 型 模式 包括 两 种 类 型 的 表 : 事实 表 和 维 表 。 事 实 表 (fact table ) 包含 实际 的 、 与 业务 有 
关 的 定量 数据 ， 例 如 销售 量 、 预 订 的 订单 等 。 维 表 (dimension table) 则 包含 关于 业务 主题 的 
描述 性 数据 。 维 表 通 常 是 在 各 种 查询 、 报 表 或 图 表 中 用 来 对 事实 加 以 限定 、 分 类 或 汇总 的 属性 
源 。 节 简单 的 星 型 模式 包括 一 个 事实 表 和 围绕 它 的 几 个 维 表 。 典 型 的 业务 维度 (主题 ) 包括 
Product、Customer 和 Period。Period 或 者 Time 总 是 维度 之 一 。 这 种 结构 如 图 11-13 所 示 ， 图 中 包 
含 四 个 维 表 。 

每 个 维 表 与 中 心 的 事实 表 之 间 是 一 对 多 的 联系 。 一 般 来 说 ， 每 个 维 表 有 一 个 主键 和 若干 非 
主键 属性 ， 而 主键 又 是 事实 表 的 外 键 (如 图 11-13 所 示 ) 。 事实 表 的 主键 则 是 由 所 有 外 键 串联 形 
成 的 复合 键 (图 11-13 里 有 四 个 键 )， 再 加 上 其 他 与 维 表 没有 对 应 关系 的 组 件 。 每 个 维 表 与 事实 
表 之 间 的 联系 为 我 们 提供 了 一 条 联结 路 径 ， 允许 用 户 利用 SQL 语句 方便 地 查询 数据 库 ， 这 些 查 
询 或 者 是 事先 定义 的 或 者 是 即席 的 。 非 键 属性 通常 称 作 数据 列 ， 如 图 11-13 所 示 。 

2. 星 型 模式 举例 

图 11-14 给 出 一 个 简单 的 星 型 模式 例子 。 该 例 包 含 三 个 维 表 PRODUCT、 PERIOD 和 STORE， 
以 及 一 个 事实 表 SALES。 事 实 表 记录 了 三 个 业务 事实 : 总 销售 量 、 总 销售 额 、 总 成 本 。 这 些 汇 
总 记录 了 产品 、 时 期 和 商店 的 每 个 可 能 值 。 

该 模式 的 一 些 样本 数据 如 图 11-15 所 示 。 对 Period 为 002 的 110 号 产品 ， 我 们 从 事实 表 里 发 现 
如 下 事实 : 

DD 在 商店 S1 售 出 30 个 该 产品 ， 总 销售 额 是 1500 美 元 ， 总 成 本 是 1200 美 元 。 

2) 在 商店 S3 售 出 40 个 该 产品 ， 总 销售 额 是 2000 美 元 ， 总 成 本 是 1200 美 元 。 

与 维度 有 关 的 其 他 细节 可 以 从 维 表 里 得 到 。 例 如 ， 在 PERIOD 中 ， 我 们 发 现 002 代 表 2001 
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年 第 一 季度 的 5 月 份 。 可 以 尝试 以 同样 方式 跟踪 其 他 维度 。 
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图 11-13 星 型 模式 的 组 成 
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图 11-14 星 型 模式 举例 
3. 替代 键 . 
用 来 联结 事实 表 与 维 表 的 每 个 键 都 应 该 是 一 个 替代 键 ( 非 智能 的 或 由 系统 指定 的 )， 而 不 
是 一 个 真正 采用 业务 值 的 键 (有 时 也 叫 智能 键 或 产品 键 )。 也 就 是 说 ， 图 11-15 中 ， 事 实 表 和 维 
表 里 的 Product_Code、Store_Code 和 Period_Code 都 是 替代 键 。 举例 来 说 ， 如 果 必 须知 道 一 种 产 
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品 的 产品 目录 编号 、 工 程 编号 或 库存 项 目 编号 ， 那 么 这 些 属 性 就 会 作为 产品 维 表 的 属性 与 
Description、Color 和 Size 一 起 存储 。 采 用 赫 代 键 的 主要 原因 如 下 (Kimball，1998 ): 

。 通 常 业务 键 会 随时 间 缓 慢 变化 ， 因 此 我 们 应 该 记 住 同一 个 业务 对 象 的 业务 键 的 旧 值 与 
值 .。 在 后 面 介 绍 减缓 变化 维度 的 内 容 中 我 们 将 看 到 ， 利 用 替代 键 可 以 方便 地 处 理 变化 键 
和 未 知 键 。 

*。 使 用 替代 键 也 便于 我 们 跟踪 相同 产品 随时 间 变 化 而 不 同 的 非 键 属性 值 。 因 此 ， 如 果 某 个 
产品 的 包装 尺寸 发 生变 化 ， 我 们 可 以 把 一 个 产品 键 与 几 个 不 同 的 赫 代 键 联 系 起 来 ， 每 个 
替代 键 对 应 不 同 的 包装 尺寸 。 

。 赫 代 键 通常 比较 简单 ， 也 比较 短 ， 尤 其 当 产 品 键 是 复合 键 时 。 

“所 有 的 替代 键 可 以 有 相同 的 长 度 和 格式 ， 无 论 其 对 应 数据 库 的 哪个 业务 维度 ， 黄 至 是 日 


期 也 不 例外 。 
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图 11-15 带 有 样本 数据 的 星 型 模式 
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4. 事 实 表 的 粒度 

星 型 模式 的 原始 数据 保存 在 事实 表 中 。 事 实 表 明 ， 决 定 所 存储 的 详细 事实 数据 的 最 低级 别 
是 数据 集 市 设计 过 程 中 最 为 重要 的 一 步 。 数 据 的 详细 级 别 由 组 成 事实 表 主 键 的 所 有 部 分 的 交集 
决定 。 主 键 的 交集 称 为 事实 表 的 粒度 (grain )。 确 定 粒度 是 非常 关键 的 一 个 方面 ， 而 且 从 业务 
决策 的 角度 而 言 也 必须 确定 粒度 。 通 过 利用 维度 属性 进行 聚合 是 汇总 事实 数据 的 一 个 方法 ; 但 
是 在 数据 集 市 里 没有 办 法 在 小 于 事实 表 粒 度 的 细节 级 别 上 理解 业务 活动 。 

可 能 的 最 小 粒度 即 为 每 个 业务 事务 ， 如 产品 销售 单据 上 的 某 一 项 、 一 条 职员 变动 命令 、 材 
料 收 据 上 的 某 : 一 项 、 关 于 保险 策略 的 一 项 声明 、 一 个 ATM 交 易 等 。 事 务 级 粒度 允许 用 户 执行 购 
物 篮 分 析 (market basket analysis ) ， 购 物 篮 分 析 可 以 对 某 个 顾客 的 购买 行为 进 待 研究 。 高 于 事 
务 级 别 的 粒度 可 以 是 某 天 的 产品 销售 量 、 某 月 在 基 个 特定 仓库 的 所 有 原材料 收据 或 者 是 某 个 
ATM 会 话 上 所 有 ATM 事 务 的 净 效 应 。 事 实 表 的 粒度 越 小 ， 存 在 的 维度 越 多 ， 存 在 的 事实 行 也 
越 多 ， 通 常情 况 下 ， 数 据 集 市 模型 与 运作 数据 存储 的 数据 模型 也 越 接近 。 

在 数据 集 市 技术 有 一 定局 限 性 的 情况 下 ，Kimball (2001) 和 其 他 专家 推荐 采用 尽 可 能 小 
的 粒度 。 尽 管 最 初 数据 集 市 的 用 户 可 能 只 需要 某 个 聚合 级 别 的 粒度 ， 然 而 在 使 用 一 段 时 间 后 ， 
用 户 可 能 会 问 一 些 更 加 详细 的 问题 (下 钻 ) 以 解释 为 什么 存在 某 种 聚合 模式 。 而 那 时 ， 已 经 不 
可 能 再 “下 钻 ” 到 事实 表 的 粒度 之 下 (不 包括 转向 其 他 的 数据 源 ， 如 EDW 、ODS 或 者 最 初 的 
源 系 统 ， 因 为 分 析 起 来 相当 困难 )。 

5. 事实 表 的 尺寸 

和 我 们 所 预期 一 样 ， 事 实 表 的 粒度 对 事实 表 的 尺寸 有 直接 的 影响 。 我 们 可 以 用 下 面 的 方法 
估计 事实 表 的 行 数 : 

1) 为 每 个 与 事实 表 相 关 的 维度 估计 可 能 值 的 数目 ( 换 句 话说 ， 喜 是 事实 表 中 每 个 外 键 可 能 
值 的 数目 )。 

2) 在 作出 任何 必要 的 调整 后 ， 把 1 所 得 到 的 所 有 值 相 乘 。 

现在 ， 把 上 述 方法 应 用 到 图 11-15 所 示 的 星 型 模式 中 。 假 定 维度 采用 如 下 值 : 

商店 总 量 : 1000 

产品 总 量 : 10 000 

时 间 总 量 : 24 (两 年 的 月 数据 ) 

虽然 产品 总 量 为 10 000， 但 某 个 月 内 可 能 只 记录 了 一 部 分 产品 的 销售 情况 。 因 为 事实 表 只 记 
录 某 个 月 的 销售 情况 ， 所 以 我 们 需要 调整 这 个 数字 。 假 定 每 个 月 记录 了 大 概 50% (或 者 说 5000) 
产品 的 销售 人 情况， 那么， 事实 表 的 行 数 可 以 估算 如 下 : 

总 行 数 = 1000 (商店 ) x 5000 (活动 产品 ) x 24 (月 ) 

= 120 000 000 ( 行 ) 


因此 ,在 这 个 简单 的 例子 中 ， 包 含 两 年 的 月 数据 的 事实 表 的 行 数 超过 1 亿 行 。 本 例 清楚 地 
说 明 ， 事 实 表 的 尺寸 是 维 表 的 很 多 倍 。 比 如 ，STORE 表 只 有 1000 行 ，PRODUCT 表 有 10 000 行 ， 
而 PERIOD 表 只 有 24 行 。 

如 果 我 们 知道 事实 表 每 个 字段 的 尺寸 ， 就 能 够 进一步 估算 以 字 节 为 单位 的 表 的 尺寸 。 图 
11-15 中 事实 表 (名 为 SALES) 有 六 个 字段 。 如 果 每 个 字段 的 平均 长 度 为 四 个 字 节 ， 则 事实 表 
总 的 尺 计 就 可 以 用 如 下 方法 估算 : 

总 尺寸 = 120 000 000 ( 行 ) x6 (字段 ) x4 ( 字 节 /字段 ) 

=2 880 000 000 或 2.88G ( 字 节 ) 
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事实 表 的 尺寸 取决 于 维度 的 个 数 和 事实 表 的 粒度 。 假 定 在 使 用 一 段 时 间 图 11-15 所 示 的 数 
据 库 后 ， 营 销 部 门 要求 在 事实 表 中 累加 每 日 的 销售 总 数 (这 是 一 种 典型 的 数据 集 市 演变 )。 随 
着 表 的 粒度 变 为 每 日 项 目 总 计 ， 事 实 表 的 行 数 也 可 以 用 如 下 方法 估算 : 

总 行 数 =1000 (商店 ) x 2000 (活动 产品 ) x720 (天 ) 

=1 440 000 000 ( 行 ) 

在 上 述 计 算 中 ， 我 们 假定 每 天 大 约 有 20% 的 产品 有 销售 记录 。 此 时 ， 数 据 库 行 数 将 超过 10 
亿 ， 而 数据 库 的 尺寸 则 变 为 : 

总 尺寸 = 18440 000 000 ( 行 ) x6 (字段 ) x4 ( 字 节 /字段 ) 

二 34 560 000 000 或 34.56G ( 字 节 ) 

现在 ,许多 大 的 零售 商 ( 如 沃尔玛 、Kmart、Sears) 和 电子 商务 站 点 (如 Travelocity.com 
和 MatchLogic.com) 都 拥有 自己 的 数据 仓库 (或 数据 集 市 )， 这 些 数 据 仓库 中 大 多 数 的 尺寸 都 
在 儿 个 TB 左右 。 而 且 ， 随 着 营销 人 员 不 断 要 求 事实 表 具 有 更 多 的 维度 和 更 小 的 粒度 ， 这 些 数 
据 仓 库 的 尺寸 还 会 快速 增长 。 

6. 对 日 期 和 时 间 建 模 

因为 数据 集 市 随时 间 变 化 记录 不 同 维度 的 事实 ， 所 以 日 期 和 时 间 〈 此 后 简称 日 期 ) 总 是 一 
个 维 表 ， 而 日 期 灰 代 键 也 一 直 都 是 任何 事实 表 的 主键 的 组 成 部 分 。 由 于 用 户 可 能 想 聚合 日 期 的 
许多 不 同方 面 的 事实 ， 因 此 日 期 维度 可 以 有 许多 非 键 属性 。 同 样 ， 因 为 日 期 的 某 些 特征 是 与 特 
定 地 区 或 是 特定 事件 有 关 的 (例如 ， 某 个 日 期 是 假期 或 者 在 某 天 会 发 生 某 些 标准 事件 ， 比 如 过 
年 或 举行 足球 赛 等 )， 对 日 期 维度 建 模 会 比 目 前 所 阐述 的 更 为 复杂 。 

图 11-16 显 示 了 日 期 维度 的 一 种 典型 设计 。 正 如 我 们 前 面 所 看 到 的 ， 日 期 替代 键 作 为 事实 
表 主 键 的 一 部 分 出 现 ， 并 且 是 日 期 维 表 的 主键 。 日 期 维 表 的 非 键 属性 包括 日 期 的 所 有 特征 ， 用 
户 利用 这 些 日 期 对 不 随地 点 或 事件 而 改变 的 事实 进行 分 类 、 汇 总 和 分 组 。 对 于 一 个 在 不 同 国家 
(或 不 同 的 地 理 位 置 ， 在 那些 地 方 日 期 的 特征 有 所 不 同 ) 开展 业务 的 组 织 而 言 ， 我 们 可 以 添加 
一 个 Country Calendar 表 ,该 表 用 于 记录 在 每 个 地 方 的 每 个 日 期 的 特征 。 因 此 ，Date 键 是 
Country Calendar 表 的 一 个 外 键 ， 通 过 组 合 Date 键 和 Country ，Country Calendar 表 的 每 一 行 都 是 
惟一 的 ， 所 以 ，Date 和 Country 形 成 该 表 的 复合 主键 。 同 样 ， 对 于 某 个 日 期 发 生 某 个 特别 事件 
的 情况 而 言 (为 了 简单 起 见 ， 我 们 假定 某 个 给 定 日 期 所 发 生 的 特殊 事件 不 超过 一 个 ) ， 也 可 以 
通过 创建 事件 表 规 范 化 Event 数 据 ， 因 此 每 个 事件 的 描述 性 数据 (如 “Strawberry Festival” 或 
“Homecoming Game”) 只 需 存储 一 次 。 

Country Calender 表 日 期 维 表 事实 表 


_ Date key [PKJIFK Date key [PK] 

， 2 Full date 

Day of week 

Day number in month 
Day number overall 
Week number in year 
Week number overall 
Month 





Month number overall 


Quarter 


Fiscal period 
Weekday flag 

Last day in month flag 
Event key [FK] 


图 11-16 对 日 期 建 模 


多 11 竟 数据 仓库 385 








11.8.3 星 型 模式 的 变 体 

上 面 所 介绍 的 简单 星 型 模式 对 许多 应 用 而 言 已 经 足够 了 。 但 是 ， 为 了 处 理 更 复杂 的 建 模 问 
题 ， 通 常 需要 对 该 模式 进行 各 种 扩展 。 在 本 节 中 ， 我 们 将 简要 地 介绍 两 种 扩展 : 多 事实 表 和 雪 
花 模式 。 想 要 更 多 了 解 其 他 扩展 和 变 体 ， 可 以 参考 Poe (1996) 及 www.ralphkimball.com。 

1. 多 事实 表 

为 了 改善 性 能 或 其 他 原因 ， 经 常 需要 在 给 定 星 型 模式 中 定义 多 个 事实 表 。 例 如 ， 假 设 不 同 
用 户 需要 不 同 级 别 的 聚合 ( 换 句 话说 ， 有 不 同 的 表 粒 度 ) ， 通 过 为 每 种 聚合 级 别 定义 不 同 的 事 
实 表 有 助 于 改善 性 能 。 这 种 做 法 的 明显 缺点 是 : 随 着 新 表 的 增加 ， 存 储 要 求 也 会 急剧 升 高 。 更 
为 一 般 的 情况 是 ， 需 要 多 事实 表 存储 用 于 不 同 维度 组 合 的 事实 。 

图 11-17 说 明了 多 事实 表 的 一 种 典型 情况 ， 该 图 包含 两 个 相关 的 星 型 模式 ， 另外 还 包含 两 
个 事实 表 分 别处 于 两 个 星 型 模式 的 中 心 位 置 : 

1) Sales 一 一 关于 某 天 在 某 个 商店 对 某 个 顾客 销售 某 个 商品 的 事实 。 

2) Receipts 关于 某 天 某 个 供应 商 的 商品 入 库 的 事实 。 

在 这 种 情形 下 出 现 的 一 个 共同 问题 是 : 有 关 一 个 或 多 个 业务 主题 的 数据 (本 例 中 为 Product 
和 Date) 应 该 被 存储 到 每 个 事实 表 的 维 表 中 。 丰 攻 计 电 要 以 东 用 轴 各 万 法 不 天地 才 的 北齐 癌 是。 
一 种 情况 是 ， 因 为 Sales 表 和 Receipts 表 中 对 商品 的 描述 差异 很 大 ， 所 以 创建 两 个 商品 维 表 ; 另 
外 一 种 情况 是 ， 由 于 用 户 需要 相同 的 日 期 描述 ， 所 以 使 用 同一 个 日 期 维 表 。 在 这 两 种 情况 下 ， 
都 要 求 创建 一 致 性 维度 (conformed dimension )。 也 就 是 说 ， 对 每 个 事实 表 ， 维 度 的 意义 都 相 
同 ， 因 此 ， 维 表 可 以 采用 相同 的 替代 主键 。 即 使 两 个 星 型 模式 分 别 存 储 在 不 同 的 物理 数据 集 市 
中 ， 但 只 要 维度 是 一 致 的 ， 就 可 以 跨 数据 集 市 提出 问题 。( 例如 ， 某 个 供应 商 的 产品 销售 的 更 
快 吗 ? 他 们 能 在 较 短 时 间 内 补 货 吗 ? ) 简单 来 说 ， 一 致 性 维度 允许 用 户 : 

。 共 享 非 键 维度 数据 。 

。 跨 事实 表 的 一 致 性 查询 。 

* 在 意义 统一 的 事实 和 业务 主题 上 工作 。 


Store Customer 





Sales-Product 


Warehouse 


Warehouse key Vendor key 


图 11-17 一 致 性 维度 





2. 无 事实 的 事实 表 
有 一 些 应 用 的 事实 表 没 有 非 键 数据 ， 而 只 包含 与 维 有 关 的 外 键 。 无 事实 的 事实 表 通 常 在 以 
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下 两 种 情况 中 应 用 : 跟踪 事件 (如 图 11-18a 所 示 )， 列 出 可 能 发 生 的 事件 集合 〈 称 为 覆盖 ) ( 参 
见 图 11-18b)。 图 11-18a 中 的 星 型 模式 跟踪 某 个 学 生 在 某 个 时 间 利用 某 种 教学 仪器 参加 某 个 教师 
教授 的 某 门 课程 。 应 该 知道 的 所 有 事实 就 是 是 否 发 生 该 事件 ， 答 案由 五 个 外 键 的 交集 表示 。 图 
11-18b 所 示 的 星 型 模式 则 显示 某 个 商店 在 某 个 时 间 利 用 某 种 促销 方式 时 ， 某 种 商品 可 能 的 销售 
情况 。 图 11-18b 没 有 显示 另外 一 张 销售 事实 表 ， 除 了 相同 的 维度 组 合 〈 与 Promotion 事 实 表 相同 
的 四 个 外 键 ) 以 外 ， 这 张 表 还 包含 销售 数 和 销售 额 ( 非 键 事实 )。 利 用 这 两 个 事实 表 和 四 个 一 
致 性 维度 ， 通 过 在 促销 事实 表 中 发 现 四 个 键 值 的 某 个 组 合 在 销售 事实 表 中 并 不 存在 ， 就 能 够 得 
出 某 种 商品 在 某 个 时 间 在 某 个 商店 的 某 次 促销 活动 里 没有 卖 出 去 〈 即 销售 额 为 零 ) 的 结论 。 如 
果 只 有 销售 事实 表 则 不 足以 回答 这 个 问题 ， 因 为 在 销售 事实 表 里 不 可 能 有 四 个 键 值 的 组 合 对 应 
销售 额 为 零 的 一 行 记录 。 

Time key [PK] 


es Student key [PK] 


Attendance 事实 表 
Time key [PKJ[FK] 
Student key [PK]{FK] 
Course key [PK]{FK] 


Teacher key [PK]{FK]} 
Facility key [PKJ[FK] 





a) 显示 发 生 某 个 事件 的 无 事实 事实 表 


Time key [PK][FK] 
Product key [PK]{FK] 


Store key [PK]IFK] 
Promo key [PK][FK] 





b) 显示 覆盖 的 无 事实 事实 表 
图 11-18 无 事实 的 事实 表 
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11.8.4 维 表 的 规范 化 

事实 表 是 完全 规范 化 的 ， 因 为 每 个 事实 依赖 且 仅 依赖 于 复合 主键 。 而 另 一 方面 ， 维 表 可 能 
不 是 规范 化 的 。 大 多 数 数据 仓库 专家 认为 ， 可 以 将 数据 集 市 进行 优化 和 简化 以 适应 某 个 用 户 群 
体 ， 这 样 ， 所 有 的 维度 数据 只 是 远离 相关 事实 的 一 个 联结 。 有 时 ， 正 如 任何 关系 数据 库 一 样 ， 
非 规范 化 维 表 的 异常 常常 会 在 进行 添加 、 更 新 和 删除 时 产生 问题 。 在 本 节 中 ， 我 们 会 讨论 有 必 
要 对 维 表 做 进一步 规范 的 各 种 情形 。 

1. 多 值 维度 

对 于 相同 的 业务 主题 ， 有 必要 把 事实 的 取 值 限定 在 一 定 范围 内 。 图 11-19 展 示 了 一 个 有 关 
医院 的 例子 。 本 例 中 ， 医 院 在 某 天 对 某 个 病人 的 收费 和 付费 (比如 说 ，Finances 表 的 所 有 外 键 ) 
与 一 次 或 多 次 诊断 有 关 ( 通 过 连接 Diagnosis 表 和 Finances 表 之 间 M:N 联 系 的 虚线 表明 了 这 一 点 )。 
可 以 用 最 重要 的 一 次 诊断 作为 Finances 表 主键 的 组 成 部 分 ， 但 这 就 意味 着 我 们 有 可 能 失去 与 该 
行事 实 相关 的 其 他 几 次 诊断 的 重要 信息 。 或 者 ， 可 以 在 Finances 表 中 设计 固定 数目 的 诊断 键 ， 
该 数目 大 于 与 Finances 表 的 一 行 数据 相关 的 可 能 诊断 次 数 ， 但 这 又 会 产生 很 多 主键 为 空 的 行 数 
据 ， 这 种 情况 是 违反 关系 数据 库 性 质 的 。 最 佳 方法 (规范 化 方法 ) 就 是 创建 一 个 表 作 为 
Diagnosis 表 和 Finances 表 之 间 的 关联 实体 。 在 数据 仓库 的 数据 库 领 域 里 ， 这 种 表 被 称 为 “助手 
表 ” ,在 后 面 几 节 中 我 们 还 会 陆续 看 到 更 多 助手 表 的 例子 。 助 手表 可 以 有 (任何 关联 实体 表 都 
可 以 有 的 ) 非 键 属性 ， 例 如 图 11-19 所 示 “Diagnosis group” 表 里 的 weight factor ( 加权 因 子 )， 
它 表 明 在 某 个 诊断 组 里 各 次 诊断 所 起 的 作用 ， 一 个 诊断 组 所 有 诊断 的 加 权 因 子 的 和 被 归 一 化 为 
100%。 男 外 还 要 注意 ，Finances 表 里 可 能 会 有 多 行 与 同一 个 诊断 组 相关 联 。 


Diagnosis 维 表 


Date key [PK][FK] 
Patient key [PKJ[FK] 
Provider key [PK][FK] 


Location key [PKJ[FK] 

Service performed key [PKJ[FK] 
Diagnosis group key [PK][FK] 
Payer key [PK][FK] 

Amount charged 

Amount paid 


Finance 事 实 表 





图 11-19 多 值 维度 

2. 层次 结构 

很 多 时 候 ， 星 型 模式 的 某 个 维度 会 自然 形成 层次 结构 。 例 如 ， 地 理 层次 结构 (市场 - 州 - 
地 区 -国家 )， 商 品 层次 结构 (小 包装 -商品 - 捆 - 箱 )。 当 某 个 维度 构成 层次 结构 时 ， 数 据 库 设 
计 者 可 以 有 以 下 两 种 选择 : 

1) 在 一 个 单独 的 非 规 范 化 的 维 表 里 包含 层次 结构 中 每 一 层 的 所 有 信息 ， 这 种 方法 会 产生 相 
当 大 的 元 余 和 更 新 异常 。 

2) 把 该 维度 规范 化 为 一 组 贱 套 的 表 ， 表 与 表 之 间 呈 1:M 联 系 。 此 时 ,聚合 层次 结构 中 任何 
层次 上 的 事实 数据 仍然 是 可 能 的 ， 但 用 户 必 须 得 沿 着 层次 路 线 进行 符 套 联结 ， 或 者 向 用 户 提供 
-个 预先 联结 的 层次 视图 。 
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现在 ， 让 我 们 考虑 一 个 典型 的 咨询 公司 的 例子 ， 该 公司 为 顾客 开具 特定 时 间 段 关于 项 目的 
发 票 。 在 这 种 情况 下 ， 一 张 收 入 事实 表 可 以 显示 每 张 发 票 记 入 了 多 少 小 时 的 多 少 收入 ， 发 票 中 
记录 了 特定 的 时 间 段 、 特 定 的 顾客 、 特 定 的 服务 、 特 定 的 员工 和 特定 的 项 目 。 因 为 可 以 为 相同 
组 织 的 不 同 部 门 而 进行 这 种 咨询 工作 ， 所 以 如 果 我 们 想 知 道 在 顾客 组 织 的 任何 级 别 上 咨询 所 起 
的 总 体 作用 ， 就 需要 一 个 顾客 层次 结构 。 组 织 各 部 门 之 间 的 这 种 层次 结构 属于 递归 关系 。 如 图 
5-17 所 示 ， 在 规范 化 数据 库 中 表示 该 层次 结构 的 标准 方式 就 是 在 公司 行 中 放 入 一 个 外 键 ， 用 以 
代表 其 父母 的 单位 。 

用 上 述 方式 实现 的 递归 联系 对 于 进行 决策 的 终端 用 户 来 说 是 非常 困难 的 ， 因 为 确定 在 某 个 
层次 上 如 何 进行 聚合 要 求 编写 复杂 的 SQL 程序 。 另 外 一 种 较为 简单 的 方法 如 图 11-20 所 示 。 图 
11-20a 显 示 如 何在 数据 仓库 中 利用 助手 表 对 层次 结构 建 模 的 方法 (Kimball，1998b; Chisholm， 
2000)。 咨 询 公司 所 服务 的 组 织 的 每 个 部 门 都 被 分 配 了 一 个 不 同 的 客户 替代 键 和 Customer 维 表 
中 的 一 行 ， 该 客户 替代 键 在 Revenue 事 实 表 中 被 用 作 外 键 。 在 一 个 任意 深度 的 递归 联系 中 进行 
联结 所 面临 的 问题 是 : 用户 不 得 不 编写 代码 进行 任意 次 数 的 联结 (每 个 附属 级 别 都 要 进行 一 次 
联结 )， 而 数据 仓库 的 这 些 联结 ， 因 为 其 尺寸 过 大 ， 可 能 会 非常 耗 时 (除非 利用 某 些 高 性 能 的 
使 用 了 并 行 处 理 的 数据 仓库 技术 )。 为 了 避免 该 问题 ， 助 手表 通过 在 一 行 中 记录 每 个 部 门 的 子 
部 门 和 包括 其 本 身 在 内 的 上 级 部 门 (所 有 通 往 客户 组 织 顶 层 的 路 径 ) 把 层次 关系 扁平 化 了 。 庐 
助手 表 的 每 一 行 都 有 三 个 描述 符 一 一 该 行 子 部 门 距离 上 级 部 门 的 层 数 ， 该 子 部 门 是 否 为 最 低层 
的 标志 ， 该 子 部 门 是 否 为 最 高 层 的 标志 。 图 11-20b 描 述 一 个 客户 组 织 层 次 结构 的 实例 以 及 助手 
表 中 代表 整个 组 织 的 行 (其 他 客户 组 织 的 子 部 门 - 父 部 门 关系 在 助手 表 的 其 他 行 中 记录 )。 





Customer 表 





a) 助手 表 的 使 用 





ABC Automotive 


Parent key Subkey Depth Lowest Topmost 
C0000001 C0O00000 








SS ODL RN ee 
<<x<<x<x<xZx<xZZ 
2 2 2 





Customer key Name Type 
C0000001 ABC Automotive 100 1st St，Dealer 
ABC Auto Sales 110 1st St，Sales 层次 结构 助手 表 





ABC Repair 130 1st St. Service 
ABC Auto New Sales 110 1st St. Sales 
ABC Auto Used Sales 110 1st St. Sales 





Customer 表 
b) 带 有 客户 表 和 助手 表 的 层次 结构 实例 
图 11-20 在 一 个 维度 中 表示 层次 关系 
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图 11-20a 中 的 Revenue 事 实 表 有 一 个 非 键 属性 : Invoice Number。 该 属性 就 是 所 谓 的 生成 维 
度 (generative dimension) 的 一 个 实例 ， 它 没有 感 兴 趣 的 维度 属性 (所 以 不 存在 相应 的 维 表 ， 
Invoice Number 也 不 是 表 的 主键 的 组 成 部 分 )， 而 且 也 不 是 被 用 于 聚合 的 事实 。 但 是 ， 如 果 需 要 
开发 一 个 能 发 现 关于 发 票 事务 其 他 细节 的 ODS 或 源 系统 ， 则 该 属性 是 有 用 的 。 

当 维 表 通 过 利用 助手 表 ( 有 时 也 称 为 桥 表 或 参照 表 ) 而 得 到 进一步 规范 化 时 ， 简 单 的 星 型 
模式 就 演变 成 雪花 模式 (snowflake schema)。 雪 花 模式 类 似 于 一 个 ODS 或 源 数据 库 的 片段 ， 以 
汇总 为 事实 表 的 事务 表 为 中 心 ， 所 有 其 他 表 直 接 或 间接 地 与 这 些 事务 表 相 关联 。 很 多 数据 仓库 
专家 并 不 鼓励 使 用 雪花 模式 ， 因 为 这 种 模式 对 用 户 而 言 过 于 复杂 ， 并 且 需 要 更 多 的 联结 操作 才 
能 把 结果 放 在 一 个 表 中 。 然 而 ， 如 果 规 范 化 可 以 节省 大 量 的 元 余 空间 (例如 ， 有 很 多 元 余 的 、 
长 文本 的 属性 时 ) 或 者 用 户 认为 浏览 规范 化 表 非 常 有 用 时 ， 雪 花 模 式 也 是 值得 使 用 的 。 
11.8.5 缓慢 变化 的 维度 

数据 仓库 和 数据 集 市 随时 间 流 逝 一 直 在 跟踪 业务 活动 。 业 务 不 会 随 着 时 间 流 逝 而 保持 静 
止 一 一 商品 会 改变 尺寸 和 重量 ， 笑 客 也 会 发 生变 化 ， 商 店 会 改变 布局 ， 销 售 人 员 也 会 到 不 同 
的 地 方 开展 工作 。 大 多 数 记录 系统 仅仅 记录 业务 主题 的 当前 值 ( 比 如， 当前 的 蜂 客 地 址 )。 但 
是 在 数据 仓库 或 数据 集 市 中 ， 我 们 应 该 了 解 历史 值 ， 以 便 把 历史 事实 与 事实 发 生 时 正确 的 维度 
描述 匹配 起 来 。 例 如 ， 我 们 应 该 在 发 生 某 个 销售 事实 的 时 间 段 内 将 该 销售 事实 与 相关 顾客 描述 
之 间 关 联 起 来 ， 这 个 描述 可 能 并 不 是 对 客户 的 当前 描述 。 当 然 ， 了 业务 主题 的 变化 与 大 多 数 运作 
事务 相 比 而 言 是 较为 缓慢 的 。 因 此 ， 我 们 说 维度 数据 是 不 断 变 化 的 ， 只 是 变化 速度 较 慢 。 

可 以 用 如 下 三 种 方式 来 处 理 变化 着 的 维度 属性 (Kimball，1996b 和 1999): 
1) 用 新 值 重 写 当前 值 。 但 由 于 这 种 方式 删除 了 解释 历史 事实 时 所 需 的 描述 ， 所 以 是 不 可 行 
的 。 

2) 为 每 个 变化 的 维度 属性 建立 一 个 当前 值 字段 和 若干 旧 值 字段 (例如 ， 有 固定 数量 事件 的 
多 值 属性 )。 如 果 在 数据 仓库 的 某 段 历史 时 间 里 可 以 预测 维度 变化 的 数量 ， 那 么 这 种 方案 是 可 
行 的 (比如 ， 我 们 保持 24 个 月 的 历史 ， 并 且 某 个 属性 的 值 最 多 一 个 月 变化 一 次 )。 但 是 ， 这 种 
方法 只 能 在 受 约 东 的 假定 下 奏效 ， 而 不 适用 于 任何 缓慢 变化 的 维度 属性 。 

3) 每 次 维度 对 象 改变 时 都 建立 一 个 新 的 维 表 行 (有 一 个 新 键 )， 这 个 新 行 包含 所 有 的 维度 
特征 。 这 个 新 键 与 事实 行 相关 联 ， 键 的 属性 在 事实 所 发 生 的 时 候 应 用 。 还 可 以 存储 变化 发 生 的 
日 期 /时 间 及 变化 发 生 的 原因 代码 。 这 种 方法 使 我 们 可 以 根据 需要 建立 维度 对 象 变化 。 不 过 ， 
如 果 行 频繁 改变 或 者 行 很 长 ， 那 么 这 种 方法 就 显得 很 笨拙 。 

第 三 种 方案 是 处 理 缓慢 变化 维度 的 一 种 常用 方法 。 利 用 这 种 方案 ， 也 可 以 在 维度 行 里 为 初 
始 对 象 存储 替代 键 值 ， 从 而 可 以 把 所 有 变化 与 它们 的 初始 值 联 系 起 来 。 

不 过 ， 需 要 注意 的 是 ， 当 维度 对 象 频繁 改变 或 维度 行 较 大 时 ， 维 表 的 行 数 可 能 会 变 得 非常 
大 。 图 11-21 展 示 了 处 理 这 种 情况 的 一 种 方法 一 一 维度 分 段 ， 该 方法 还 能 处 理 一 种 更 为 普遍 的 情 
况 一 一 维度 属性 的 子 集 以 不 同 的 频率 发 生变 化 。 在 这 个 例子 中 ，Customer 维 度 被 分 成 两 个 维 表 : 
一 张 表 保存 几乎 不 变化 或 变化 速度 非常 缓慢 的 维度 , 而 另 一 张 表 保 存 变 化 速度 较 快 的 属性 豪 秘 ， 
相同 诊 铸 的 属性 同时 发 生变 化 。 这 些 变 化 较 快 的 属性 通常 被 数据 仓库 设计 者 称 为 “ 热 ”属性 。 

分 割 的 另 一 个 方面 是 ， 对 于 热 属性 ， 可 以 把 一 个 单 值 维度 属性 改变 为 范围 维度 属性 ， 如 把 
顾客 收入 从 $75 400/ 年 变 成 $60 000 ~ $89 999/ 年 。 范 围 可 以 由 用 户 根据 需要 定义 ， 可 以 大 一 些 
也 可 以 小 一 些 。 当 然 ， 这 种 方法 会 失去 一 些 精确 性 ， 但 范围 的 使 用 使 热 属 性 变 得 不 是 那么 “ 热 ” 
了 ， 因 为 如 有 果 属 性 的 变化 处 于 该 范围 内 ， 那 么 就 不 会 导致 向 维 表 写 和 一 个 新 行 。 不 过 ， 这 种 设 
计 对 用 户 而 言 非常 复杂 ， 因 为 根据 分 析 ， 他 们 也 许 不 得 不 将 事实 与 多 个 维度 片段 联结 起 来 。 
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Customer 维 表 的 两 个 分 割 


几乎 不 变化 或 缓慢 
变化 的 属性 












Customer key [PKJ{FK] 
Demographic key [PK][FK] 
Other keys [PK][FK] 

Facts 


图 11-21 维度 分 割 


11.9 用 户 界面 


“有 产品 就 有 市 场 ”策略 在 某 些 场合 也 许 奏 效 ， 但 对 于 数据 仓库 和 数据 集 市 而 言 可 能 不 一 
定 适用 。 即 使 是 一 个 设计 良好 的 数据 集 市 ， 并 且 装 载 了 相关 数据 ， 也 可 能 无 法 使 用 ， 除 非 提 供 
给 用 户 一 个 功能 强大 的 直观 的 界面 ， 使 得 他 们 能 够 很 容易 地 访问 和 分 析 这 些 数 据 。 在 本 节 中 ，， 
我 们 将 对 现代 数据 仓库 的 界面 进行 简要 介绍 。 

目前 有 各 种 工具 可 以 用 来 查询 和 分 析 数 据 仓 库 或 数据 集 市 中 存储 的 数据 。 这 些 工具 大 体 可 
分 为 如 下 几 类 : 

1) 传统 的 查询 和 报表 工具 。 

2) 联机 分 析 处 理 (OLAP)、MOLAP 和 ROLAP 工 具 。 

3) 数据 挖掘 工具 。 

4) 数据 可 视 化 工具 。 

传统 的 查询 和 报表 工具 包括 电子 表格 、PC 数 据 库 、 报 表 编 写 程序 和 生成 程序 。 由 于 篇 幅 
所 限 (也 因为 在 相关 的 参考 书 里 已 经 包含 了 这 部 分 内 容 )， 我 们 在 这 里 不 再 介绍 这 些 工具 。 本 
节 在 讨论 元 数据 的 作用 之 后 ， 主 要 讲述 其 他 三 类 工具 。 
11.9.1 元 数据 的 作用 

建立 一 个 友好 用 户 界面 的 首要 条 件 就 是 有 一 组 元 数据 ， 它 们 用 便于 用 户 理解 的 业务 术语 描 
述 数据 集 市 中 的 数据 。 图 11-6 展 示 了 在 三 层 数据 体系 结构 中 元 数据 与 数据 集 市 的 关联 。 

与 数据 集 市 相关 的 元 数据 通常 称 为 “数据 目录 ”(data catalog 或 data directory ) 。 元 数据 对 
于 数据 集 市 中 的 数据 起 到 一 种 类 似 “ 黄 页 ”的 作用 。 有 了 元 数据 ， 用 户 就 能 很 容易 地 回答 下 面 
的 问题 : 

1) 数据 集 市 描述 什么 主题 ? (典型 的 主题 有 : 顾客、 病人、 学生、 产品、 课程 等 等 。) 

2) 数据 集 市 包括 哪些 维和 事实 ”事实 表 的 粒度 是 什么 ? 

3) 数据 集 市 的 数据 如 何 从 EDW 的 数据 中 导出 ? 在 导出 时 使 用 了 什么 规则 ? 

4) EDW 的 数据 如 何 从 运作 数据 中 导出 ?在 导出 中 使 用 了 什么 规则 ? 
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5) 为 了 查看 数据 ， 可 以 使 用 哪些 报表 和 预定 义 的 查询 ? 

6) 可 以 使 用 哪些 “下 钼 ”和 其 他 数据 分 析 技 术 ? 

7) 谁 负责 数据 集 市 中 数据 的 质量 ”向 谁 提出 变化 请 求 ? 
11.9.2 查询 工具 

SQL 作为 使 用 最 普遍 的 数据 库 查 询 语言 (参见 第 7 章 和 第 8 章 )， 常常 被 扩展 以 支持 数据 仓 
库 环 境 下 革 些 类 型 的 计算 和 查询 。 但 是 ， 一 般 来 说 ， SQL 不 是 一 种 分 析 语 言 (Mundy，2001 )。 
SQL-99 包 含 了 一 些 数 据 仓库 扩展 。 因为 很 多 数据 仓库 操作 都 会 处 理 某 种 类 型 的 对 象 ( 比 如 说 按 
时 间 排 序 的 对 象 )， 所 以 SQL-99 包 含 一 个 可 以 定义 一 组 动态 行 的 WINDOW 子 句 。 例 如 ， 可 以 用 
-个 WINDOW 子 句 定义 相 邻 的 三 天 ， 从 而 计算 移动 平均 值 (可 以 想像 成 一 扇 窗户 在 窗 格 的 低 
端 和 顶端 之 间 移动 ， 提 供 数据 行 的 请 动 视图 )。 WINDOW 子 句 的 PARTITION 与 GROUP BY 作用 
类 似 ， PARTITION 告 诉 WINDOW 子 句 每 组 的 基础 ，ORDER BY 子 句 对 一 组 元 素 排 序 ，ROWS 
子 句 求 得 用 于 计算 的 一 个 序列 包含 多 少 行 。RANK 窗 口 函数 能 够 计算 某 些 在 标准 SQL 中 难以 计 
算 的 内 容 ， 即 那些 基于 某 些 准 则 的 、 在 某 个 特定 相对 位 置 的 表 的 行 ( 例 如 ， 在 某 个 时 间 段 内 销 
售 额 排 在 第 三 位 的 顾客 )。WINDOW 子 句 的 实例 可 参见 8.6.1 市 。 SQL-99 并 不 是 一 个 功能 全 面 的 
数据 仓库 查询 和 分 析 工 具 ， 但 它 在 认识 决策 支持 系统 的 特殊 查询 需要 方面 的 一 个 开始 。 
11.9.3 联机 分 析 处 理工 具 

目前 已 经 开发 了 一 种 向 用 户 提供 数据 的 多 维 视图 的 特殊 工具 ， 然 后 利用 图 形 界面 就 能 够 很 
容易 地 分 析 数据 。 在 最 简单 的 情形 下 ， 可 将 数据 看 作 一 个 简单 的 三 维 立 方 体 。 

联机 分 析 处 理 (On-Line Analytical Processing，OLAP) 就 是 使 用 一 组 图 形 工具 向 用 户 提 
供 数据 的 多 维 视图 ， 并 人 允许 用 户 利用 简单 的 窗口 技术 对 数据 进行 分 析 。 之 所 以 称 之 为 “联机 分 
析 处 理 ”， 是 为 了 与 传统 的 术语 “联机 事务 处 理 ”(OLTP) 相对 比 。 这 两 种 处 理 类 型 之 间 的 区 
别 已 经 在 表 11-1 中 作 了 总 结 。 术 语 “ 多 维 分 析 ” 常 用 作 OLAP 的 同义词 。 

图 11-22 展 示 了 一 个 典型 的 OLAP“ 数 据 立方 体 ”( 或 多 维 视图 )。 该 视图 与 图 11-14 中 介绍 
的 星 型 模式 非常 接近 。 图 11-22 中 的 两 个 维度 与 图 11-14 中 的 两 个 维 表 (PRODUCT 和 PERIOD ) 
相对 应 ， 而 第 三 个 维 (名 为 Measures) 与 图 11-14 中 的 事实 表 (名 为 SALES ) 的 数据 相对 应 。 
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图 11-22 数据 立方 体 的 切片 
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OLAP 实 际 上 是 几 类 数据 仓库 和 数据 集 市 访问 工具 的 总 称 (Dyché，2000)。 关 系 OLAP 
(Relational OLAP，ROLAP) 工具 采用 SQL 的 变 体 并 把 数据 库 看 作 传 统 的 关系 数据 库 ， 无 论 它 
是 星 型 模式 还 是 其 他 的 规范 化 / 非 规范 化 表 集合 。ROLAP 工 具 直 接 访 问 数据 仓库 或 数据 集 市 。 
多 维 OLAP (Multidimensional OLAP，MOLAP) 则 是 把 数据 装 入 一 个 中 间 结 构 ， 通 常 是 三 维 
或 更 高 维 的 数组 。 因 为 MOLAP 的 使 用 比较 普遍 ， 所 以 我 们 将 在 下 面 几 节 中 详细 介绍 这 种 工具 。 
使 用 MOLAP 时 必须 注意 ， 数 据 不 仅仅 被 看 作 多 维 数组 ( 三 维 立方 体 )， 而 且 还 通过 从 数据 仓库 
或 数据 集 市 中 抽取 数据 ， 然 后 把 数据 保存 在 一 个 特殊 的 、 单 独 的 数据 存储 里 来 创建 MOLAP 数 
据 集 市 ， 只 有 借助 多 维 结构 才能 看 见 这 些 数据 。 此外， 还 有 两 种 不 太 常 用 的 OLAP 工 具 : 一 种 
是 DOLAP (Database OLAP)， 这 种 工具 是 在 DBMS 查 询 语言 中 嵌 人 OLAP 功 能 (由 非 ANSI 的 、 
专用 的 标准 SQL 系统 实现 ) ; 另 一 种 为 HOLAP (Hybrid OLAP)， 这 种 工具 既 允 许 利用 多 维 立 
方 体 也 爷 许 利用 关系 查询 语言 对 数据 进行 访问 。 

1. 对 立方 体 切 片 

图 11-22 还 展示 了 一 个 典型 的 MOLAP 操 作 一 一 将 数据 立方 体 切片 以 产生 简单 的 二 维 表 或 视 
图 。 在 图 11-22 中 ， 进 行 这 种 切片 操作 是 为 了 获得 鞋 类 商品 的 信息 ， 结 果 数 据 表 显 示 该 类 商品 
在 某 段 时 间 (月 份 ) 内 有 三 种 度量 〈 售 出 量 、 收 入 和 成 本 )。 凭 借 简 单 的 “ 拖 放 ”操作 ， 用 户 
可 以 很 容易 地 开发 其 他 视图 。 这 种 操作 通常 称 为 对 立方 体 的 “切片 或 切 块 ”。 

另外 一 种 与 切片 和 切 块 紧密 相关 的 操作 是 数据 换 轴 (data pivoting )。 这 个 术语 指 的 是 以 某 
一 个 数据 点 旋转 视图 ， 以 从 另外 一 个 角度 来 查看 数据 。 例如， 图 11-22 显 示 4 月 份 鞋 类 的 销售 数 
目 是 400， 分 析 者 可 以 旋转 该 视图 获得 4 月 份 各 个 商店 的 鞋 类 销售 量 。 

2. 下 外 

下 钻 〈dril-down) 是 另外 一 种 在 多 维 分 析 中 经 常 运用 的 操作 ， 即 在 更 详细 的 级 别 上 分 析 
给 定 的 数据 集合 。 图 11-23 显 示 了 一 个 下 钻 的 例子 ， 图 11-23a 是 一 个 指定 品牌 纸巾 的 三 种 包装 尺 
寸 (2 卷 装 、3 卷 装 和 6 卷 装 ) 的 总 体 销售 额 汇 总 报表 。 由 于 这 些 纸巾 的 颜色 也 各 不 相同 ， 所 以 
分 析 入 员 想 进行 更 详细 的 分 类 ， 即 在 上 述 包装 尺寸 下 再 将 纸巾 按 颜色 作 进 一 步 分 类 。 使 用 
OLAP 工 具 ， 通 过 鼠标 点 击 方法 可 以 很 容易 得 到 这 种 更 为 细 化 的 分 类 。 

下 钻 的 结果 如 图 11-23b 所 示 。 注 意 ， 下 钻 结果 的 表示 相当 于 向 初始 报表 中 添加 新 的 一 列 
(本 例 中 ， 添 加 了 一 列 名 为 “Color” 的 属性 )。 

执行 下 钻 操作 《正如 本 例 所 示 ) 可 能 要 求 OLAP 工 具 具 有 “回访 ”数据 仓库 的 能 力 以 获得 
下 钻 所 必须 的 细节 数据 。 仅 当 OLAP 工 具 可 以 得 到 一 组 集成 的 元 数据 时 ， 这 种 类 型 的 操作 可 以 
由 该 工具 执行 《用户 不 参与 )。 如 果 某 个 查询 需要 的 话 ， 某 些 工 具 甚至 允许 OLAP 工 具 回访 运作 
数据 。 

11.9.4 数据 挖 抉 工具 

有 了 联机 分 析 处 理 ， 用 户 可 以 搜索 所 提问 题 的 答案 。 例 如 ， 对 于 未 婚 者 和 已 婚 者 ， 谁 的 健 
康 医疗 费用 更 高 ?而 利用 数据 挖掘， 用 户 可 以 在 事实 或 观察 的 结果 中 寻找 模式 或 趋势 。 数 据 挖 
据 (data mining) 是 一 种 混合 了 多 种 技术 的 知识 发 现 ， 这 些 技术 包括 传统 的 统计 学 技术 、 人 工 
智能 技术 和 计算 机 图 形 技 术 (Weldon，1996 )。 

数据 挖 据 可 达到 以 下 三 个 目标 : 

DD) 解释 性 ”为 了 解释 一 些 观察 到 的 事件 或 状况 ， 例 如 ， 为 什么 科罗拉多 的 敞 茵 小 型 载 货 卡 
车 的 销售 量 增 加 了 ? 

2) 确定 性 ”为 了 确定 某 些 假设 ， 例 如 : 双 收 入 家 庭 是 否 比 单 收入 家 庭 更 有 可 能 购买 家 庭 医 
疗 保险 ? 
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3) 探查 性 ”为 了 新 的 或 预期 之 外 的 联系 而 分 析 数 据 ， 例 如 : 有 哪些 消费 模式 可 能 伴随 着 信 


用 卡 欺 诈 ? 
rene | Poone se | uos | 
mow | ove | s50 | 


a) 六 -总 报表 

ee | mi | oe coe | 
ow | 

me | wm | 

0 | 

0 



























SofTowel - 
ro | ep | won | | 
ro | om | wen | 0 


b) 加 入 颜色 属性 后 的 下 钻 结果 
图 11-23 下 钻 的 例子 


SofTowel 













1. 数据 挖 握 技 术 
数据 挖掘 通常 使 用 几 种 不 同 的 技术 ， 表 11-4 对 一 些 最 常用 的 技术 作 了 总 结 。 如 何 选择 合适 
的 技术 取决 于 将 要 被 分 析 的 数据 的 性 质 以 及 数据 集合 的 大 小 。 在 数据 集 市 或 EDW 中 都 可 以 进 
行 数据 挖掘 。 
表 11-4 数据 挖 扎 技 术 





技术 | 功 能 

实例 推理 (法 ) 从 现实 世界 的 实例 中 推导 规则 
规则 发 现 在 大 型 数据 集合 中 寻找 模式 和 关联 
信号 处 理 以 相同 的 特征 识别 一 组 观察 结果 
神经 网 络 基于 人 脑 的 建 模 原理 开发 预测 模型 
分 形 无 损 压 缩 大 型 数据 库 

2. 数据 挖 握 应 用 


数据 挖掘 技术 已 经 被 成 功 应 用 到 现实 世界 当中 ， 表 11-5 对 一 些 典型 的 应 用 类 型 作 了 总 结 ， 
每 种 类 型 都 给 出 了 相应 的 例子 。 数 据 挖 掘 应 用 迅速 增长 的 主要 原因 如 下 ; 

DD 数据 仓库 和 数据 集 市 中 的 数据 量 呈 指数 级 增长 ， 因 此 用 户 需 要 数据 挖掘 所 提供 的 自动 化 
技术 以 从 这 些 数据 中 挖 据 知 识 。 

2) 拥有 扩展 功能 的 新 的 数据 挖掘 工具 不 断 被 引入 。 

3) 不 断 增长 的 竞争 压力 迫使 公司 更 好 地 利用 数据 中 所 包含 的 信息 和 知识 。 
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表 11-5 典型 的 数据 挖掘 应 用 (摘自 Zaitz, 1997 及 Dyché, 2000 1) 








应 用 类 型 举 例 
人 趾 建 模 为 价值 很 高 的 顾客 、 信 贷 风 险 和 信用 卡其 诈 开 发 概 竖 义 件 
业务 趋势 分 析 傅 定 以 高 于 (或 低 于 ) 平均 水 平 的 速度 增长 的 市 场 
日 标 营 销 人 确定 促销 活动 而 向 的 顾客 或 顾客 群 
可 用 性 分 析 伍 定 产品 和 服务 的 使 用 模式 
营销 活动 的 效果 比较 营销 活动 策略 的 效果 
产 巾 亲 和 性 确定 问 时 被 购 大 的 产 曲 ， 或 者 购买 某 组 产品 的 购买 者 特征 
顾客 的 维护 和 流失 为 了 防止 顾客 继续 流失 公 竞 争 者 那 边 去 而 进行 的 顾客 行为 测试 
赢利 分 析 给 定 顾客 与 组 织 之 问 全 部 活动 的 集合 、 决 定 哪些 顾客 是 可 获 利 顾客 
顾客 价值 分 析 仿 定 在 不 同 的 年 龄 阶段 ， 哪 些 是 有 价值 的 顾客 
妃 赶 销售 基于 关键 事件 和 和牛 活 方 式 的 变化 ， 人 确定 给 顾客 提供 的 新 产品 或 服务 


11.9.5 数据 可 视 化 

一 般 而 言 ， 用 图 形 方式 表现 数据 更 便于 人 们 用 眼睛 来 分 辨 模式 。 数 据 可 视 化 (data 
visualization ) 就 是 为 了 便于 人 类 分 析 而 用 图 形 和 多 媒体 的 方式 表示 数据 。 数 据 可 视 化 的 优势 
包括 : 能 更 好 地 观察 趋势 和 模式 、 识 别 关联 和 聚焦 。 数 据 可 视 化 经 常 与 数据 挖掘 和 其 他 分 析 技 
术 同 时 使 用 。 


本 章 小 结 


当前 ， 尽 管 组 织 收集 了 大 量 数据 ， 但 大 多 数 管理 者 在 获得 制定 决策 所 需 的 信息 时 还 是 存在 
困难 。 这 种 “信息 福 沟 ”主要 是 由 以 下 两 个 因素 造成 的 ， 首先， 数据 通常 是 异 构 和 不 一 致 的 ， 
这 是 通常 是 因为 采用 分 步 系 统 开发 方法 所 造成 的 。 其 次 ， 系 统 主要 是 为 了 满足 运作 目标 而 开发 
的 ， 儿 乎 不 能 给 予 管理 者 所 需 的 信息 。 

在 运作 系统 和 信息 系统 以 及 它们 所 拥有 的 数据 之 间 存 在 着 很 大 的 差异 。 运 作 系 统 用 来 在 当 
前 基础 上 执行 业务 ， 其 主要 的 目标 是 向 用 户 提供 高 性 能 的 事务 处 理 和 数据 库 更 新 。 信 息 系统 则 
是 用 来 支持 管理 者 制定 决策 ， 其 目标 是 为 信息 工作 者 提供 便捷 的 数据 访问 和 使 用 。 

数据 仓库 的 目的 是 合并 和 集成 来 自 各 种 源 系统 的 数据 ， 并 根据 需要 改变 它们 的 格式 以 作出 
正确 的 业务 决策 。 也 就 是 说 ， 数 据 仓库 是 一 个 集成 的 、 一 致 的 、 面 向 主题 的 数据 存储 ， 其 中 的 
数据 来 自 于 各 种 源 系 统 ， 并 格式 化 为 某 种 有 意义 的 格式 以 支持 组 织 制定 决策 。 

今天 ， 大 多 数 数据 仓库 使 用 三 层 体系 结构 。 第 一 层 由 分 散在 不 同 运作 系统 中 的 数据 组 成 ; 
第 二 层 是 一 个 EDW ， 它 是 一 个 集中 化 的 、 集 成 的 企业 数据 仓库 ， 也 是 决策 支持 应 用 的 终端 用 
户 可 以 使 用 的 所 有 数据 的 控制 点 和 惟一 来 源 ; 第 三 层 是 一 系列 数据 集 市 。 数 据 集 市 是 为 了 满足 
一 个 特定 用 户 群 制定 决策 的 需求 而 限制 在 某 个 范围 内 的 数据 形成 的 数据 仓库 。 数 据 集 市 可 以 是 
独立 于 EDW 的 ， 也 可 以 是 从 EDW 中 导出 出 来 的 ， 或 者 是 EDW 的 逻辑 子 集 。 

EDW 的 数据 层 称 为 调和 数据 层 。 理 想 情况 下 ， 该 数据 层 的 特征 是 : 详细 的 、 历 史 的 、 规 
范 化 的 、 全 面 的 和 可 以 控制 质量 的 。 通 过 用 各 种 运作 系统 填充 EDW 或 运作 数据 存储 可 以 获得 
调和 数据 。 对 数据 进行 调和 需要 四 个 步骤 :从 源 系统 中 捕获 数据 ; 清洗 数据 (消除 不 一 至 
性 ) ; 转换 数据 (把 数据 转换 为 数据 仓库 所 需要 的 格式 ) ; 向 数据 仓库 装载 和 索引 数据 。 调 和 
数据 通常 不 能 由 终端 用 户 直接 访问 。 

数据 集 市 的 数据 层 被 称 为 导出 数据 层 。 终 端 用 户 为 了 制定 决策 可 以 访问 这 些 数据 。 

数据 集 市 经 常 使 用 星 型 模式 ( 多 维 模型 ) 存 储 数据 ， 它 是 关系 模型 的 变 体 。 星 型 模式 是 一 
种 简单 的 数据 库 设计 方案 ， 在 这 种 模式 中 ， 维 度数 据 与 事实 或 事件 数据 相 分 离 。 星 型 模式 包含 
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两 种 类 型 的 表 : 维 表 和 事实 表 。 事 实 表 的 大 小 在 一 定 程 度 上 依赖 于 表 的 粒度 【〔 即 细节 级 别 )。 
日 前 ， 数 据 仓库 应 用 系统 中 事实 表 超过 10 亿 行 的 情况 已 经 非常 普遍 了 。 星 型 模式 有 几 种 变 体 ， 
包括 多 事实 表 模 型 和 雪花 模式 ， 后 者 是 在 一 个 或 多 个 维度 存在 层次 结构 的 情况 下 提出 的 。 
目前 有 多 种 访问 和 分 析 决 策 支持 数据 的 终端 用 户 界面 。 联 机 分 析 处 理 (OLAP) 采用 一 组 
图 形 工 具 向 用 户 提供 数据 的 多 维 视图 (通常 用 一 个 立方 体 来 观察 数据 )。OLAP 使 数据 分 析 操作 
变 得 很 简便 ， 这 些 数据 分 析 操 作 包 括 : 切片 和 切 块 ， 数 据 换 轴 以 及 下 钻 。 数 据 挖 据 则 是 运用 复 
杂 的 技术 进行 知识 发 现 的 一 种 形式 ， 这 些 技 术 包括 传统 的 统计 学 技术 、 人 工 智 能 技术 和 计算 机 





图 形 技术 。 
本 章 复 习 
关键 术语 
聚合 粒度 周期 数据 
一 致 性 维度 增 量 抽取 调和 数据 
数据 集 市 独立 数据 集 市 刷新 模式 
数据 挖掘 信息 系统 关系 OLAP 
数据 清洗 联结 选择 
数据 转换 逻辑 数据 集 市 雪花 模 式 
数据 可 视 化 购物 篮 分 析 星 型 模式 
数据 仓库 多 维 OLAP 静态 抽取 
依赖 数据 集 市 联机 分 析 处 理 (OLAP) 临时 数据 
导出 数据 运作 数据 存储 (ODS ) 更 新 模式 
企业 数据 仓库 (EDW ) 运作 系统 主动 仓库 
事件 
复习 问题 
1. 定义 下 列 术语 : 
a. 数据 仓库 b. 数据 集 市 
c. 调和 数据 d. 导出 数据 
e. 联机 分 析 处 理 f. 数据 挖掘 
g. 星 型 模式 h. 雪花 模式 
i 粒度 j. 静态 抽取 
k. 增 量 抽取 1 事件 
2. 将 下 列 术语 和 定义 匹配 起 来 : 
~ ”事件 a. 先前 的 数据 内 容 丢 失 
周期 数据 b. 详细 的 历史 数据 
一 数据 集 市 c. 转换 数据 格式 
”是 型 模式 d. 校正 源 数 据 错 误 
一 数据 挖掘 e. 数据 没有 被 改变 或 删除 
~ 调和 数据 f. 一 种 数据 库 动作 (如 创建 ) 
一 依赖 数据 集 市 g: 限制 在 一 定 范围 内 的 数据 仓库 
一 数据 可 视 化 h. 维和 事实 表 
临时 数据 i. 知识 发 现 的 方式 
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雪花 模式 j. 从 数据 仓库 中 填充 
一 数据 转换 k. 由 层次 维度 产生 
一 -数据 清洗 1. 以 图 形 方式 表示 数据 
比较 下 列 术语 : 
静态 抽取 ; 增 量 抽取 b. 临时 数据 ; 周期 数据 
数据 仓库 ， 数 据 集 市 ， 运 作 数 据 存储 d. 数据 清洗 ; 数据 转换 
调和 数据 ; 导出 数据 f. 事实 表 ; 维 表 
星 型 模式 ; 雪花 模式 h. 独立 数据 集 市 ; 依赖 数据 集 市 ; 逻辑 数据 集 市 


指出 目前 在 许多 组 织 中 使 数据 仓库 成 为 必然 的 五 大 主要 趋势 。 
简要 描述 数据 仓库 体系 结构 的 主要 组 成 部 分 。 
列举 三 种 在 三 层 数据 仓库 体系 结构 中 出 现 的 元 数据 ， 并 简要 描述 每 种 类 型 元 数据 的 功能 。 
列举 调和 数据 的 五 条 典型 特征 。 
.列举 并 简要 描述 数据 调和 过 程 的 四 个 步 又 。 
9. 列举 在 运作 数据 中 普遍 存在 的 五 种 错误 和 不 一 致 性 。 
10. 简要 描述 利用 OLAP 工 具 很 容易 执行 的 三 种 类 型 操作 。 
11. 解释 抽取 、 转 换 和 装载 与 数据 调和 过 程 的 关系 。 
12. 解释 独立 数据 集 市 的 优 缺 点 。 
13. 解释 数据 仓库 变更 与 运作 系统 数据 库 变更 之 间 的 区 别 。 
14. 阐述 逻辑 数据 集 市 的 优 缺 点 。 
15. 列举 数据 清洗 中 的 常见 任务 。 
16. 描述 在 数据 仓库 或 数据 集 市 中 应 用 的 赫 代 键 的 特征 。 
17. 为 什么 时 间 始 终 是 数据 仓库 或 数据 集 市 中 的 维度 之 一 ? 
18. 对 于 相同 数据 仓库 环境 下 不 同 的 星 型 模式 ， 使 用 一 致 性 维度 的 目的 是 什么 ? 
19. 事实 表 可 以 没有 非 键 属性 吗 ? 为 什么 ? 
20. 在 什么 方式 下 ， 维 表 通 常 不 需要 进行 规范 化 ? 
21. 什么 是 与 维 表 相关 的 层次 结构 ? 
22. 解释 “缓慢 变化 的 维度 ”的 含意 ? 
23. 阐明 处 理 缓慢 变化 的 维度 最 常用 的 方法 。 
问题 和 练习 
1. 研究 图 11-1 所 示 的 三 张 学 生 数据 表 。 另 外 设计 一 张 表 ， 这 张 表 可 以 保存 三 张 表 所 有 的 数 
据 并 且 没 有 元 余 。 选 择 你 认为 最 适合 这 些 数据 的 列 名 称 。 
2. 下 面 这 张 表 显示 了 06/20/2001 的 一 些 简 单 的 学 生 数据 
一 一 


站 


oo 


键 名 字 专 业 
0 
002 Tom Business 
003 Sue Art 
004 Joe Math 
005 Ann Engineering 


emneemns 
下 列 事务 发 生 在 06/21/2001: 
1) 004 号 学 生 把 专业 从 Math 变 为 Business。 
2) 从 文件 中 删除 005 号 学 生 。 
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3) 新 的 006 号 学 生 被 添加 到 文件 当中 ， 他 的 名 字 是 Jim， 专 业 是 Phys Ed。 

下 列 事务 发 生 在 06/22/2001: 

1) 003 号 学 生 把 专业 从 Art 变 为 History 。 

2) 006 号 学 生 把 专业 从 Phys Ed 变 为 Basket Weaving。 

你 有 以 下 两 项 主要 任务 : 

a. 为 06/21/2001 和 06/22/2001 构 建 反 映 上 述 事 务 的 临时 数据 表 (参见 图 11-8)。 
b. 为 06/21/2001 和 06/22/2001 构 建 反映 上 述 事 务 的 周期 数据 表 (参见 图 11-9)。 

3. Millennjum College 和 希望 你 为 他 们 设计 一 个 记录 学 生成 绩 的 星 型 模式 。 其 中 有 四 个 维 表 ， 
属性 如 下 : 

。Course_Section。 其 属性 有 : Course_ID、Section_Number、Course_Name、Units、 

Room_ID、Room_Capacity。 在 某 个 学 期 、 学 校 提 供 平均 500 个 班 。 

。Professor。 其 属性 有 : Prof_ID、Prof_Name、Title、 Department_ID、 Department_Name, 

“Student。 其 属性 有 : Student_ID、Student _Name、Major。 每 个 班 平均 有 40 个 学 生 。 

" Period。 其 属性 有 : Semester_ ID、Year。 数 据 库 将 包含 30 个 时 间 段 (总 共 10 年 ) 的 数据 。 

事实 表 中 记录 的 惟一 事实 是 Course_Grade。 

4. 为 本 题 设 计 一 个 星 型 模式 ， 所 遵循 的 格式 可 以 参见 图 11-14。 

b. 使 用 上 述 给 定 的 假设 估算 事实 表 的 行 数 。 

c. 估算 事实 表 的 总 体 大 小 〈 以 字 节 为 单位 )， 假 定 每 个 字段 平均 长 度 为 5 字 节 。 

d. 班级 、 教 授 和 学 生 的 特征 都 会 随时 间 发 生 改 变 ， 在 你 设计 星 型 模式 时 如 何 考虑 这 些 改 
变 ? 为 什么 ? | 

4. 在 掌握 了 第 5 章 讲述 的 规范 化 法 则 的 基础 上 ， 读 者 应 该 能 立即 看 出 上 题 中 为 Millennium 
College 设 计 的 星 型 模式 不 符合 第 三 范式 。 请 应 用 规范 化 法 则 将 星 型 模式 转变 为 雪花 模式 。 这 
种 转换 会 影响 事实 表 的 大 小 吗 ? “ 

5. 请 你 为 Simplified Automobile Insurance Company 构 建 一 个 星 型 模式 (参见 kimball，1996， 
里 面 有 更 为 真实 的 例子 )。 有 关 的 维度 、 维 度 属性 和 维度 大 小 的 规定 如 下 所 示 : 

“Insured Party。 其 属性 包括 : Insured_Party_ID、Name。 每 张 保单 和 保险 项 目 平均 有 两 个 

投保 方 。 

“Coverage Item。 其 属性 包括 : Coverage_Key、 Description。 每 张 保单 平均 有 10 个 保险 项 

目 。 
“Agent。 其 属性 包括 : Agent_ID、Agent_Name。 每 张 保单 和 保险 项 目 有 -个 经 纪 人 。 

“Policy。 其 属性 包括 : Policy_ ID、Type。 目前 公司 大 概 有 100 万 张 保单 。 

“Period。 其 属性 包括 : Date_Ke、Fiscal_Period。 

对 这 些 维度 所 记录 的 事实 有 : Policy_Premium、 Deductible、Number_of_ Transactions 。 

a. 为 本 题 设计 一 个 星 型 模式 ， 遵 循 的 格式 可 参见 图 11-14。 
b. 应 用 上 述 假定 ， 估 计 事 实 表 的 行 数 。 
c. 估计 事实 表 的 大 小 (以 字 节 为 单位 )， 假定 每 个 字段 平均 占 5 个 字 节 。 

6. Simplified Automobile Insurance Company 想 在 星 型 模式 中 添加 一 个 Claims 维 度 。 其 属性 
包括 : Claim_ID、 Claim_Description 以 及 Claim_Type。 事实 表 目 前 的 属性 有 : Policy_Premium 、 
Deductible、 Monthly_Claim_Total。 

a. 扩展 问题 与 练习 5 中 的 星 型 模式 以 包含 上 述 新 数据 。 
b. 估计 事实 表 的 行 数 ， 假定 公司 每 个 月 处 理 平均 2000 笔 赔偿 。 
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7. Millennium 学 院 (参见 问题 与 练习 3) 现在 想 向 班级 里 添加 儿 个 新 数据 : 提供 该 课程 的 
系 ， 系 所 属 的 学 院 ， 以 及 分 配给 该 系 的 预算 。 修 改 问题 与 练习 3 的 回答 ， 以 包含 新 的 数据 。 解 
释 为 什么 采用 你 所 选择 的 实现 方法 。 

8. 在 本 章 提 到 过 ，Kimabail (1997)、Inmon (1997，2000) 以 及 Armstrong (2000) 对 独 
开 和 依赖 数据 集 市 以 及 规范 及 非 规 范 化 的 数据 集 市 之 间 的 优 劣 进行 了 争论 。 请 从 图 书馆 或 网 络 
资源 上 找到 这 些 论文 ， 并 对 争论 双方 的 观点 作 一 总 结 。 

应 用 练习 
1. 参观 某 个 已 开发 数据 仓库 的 组 织 ， 与 数据 管理 员 或 其 他 主要 参与 者 面谈 。 讨 论 以 下 问题 : 
a. 用 户 对 数据 仓库 是 否 满意 ” 它 在 哪些 方面 改善 了 用 户 的 决策 制定 过 程 ? 
b. 数据 仓库 采用 的 是 两 层 还 是 三 层 体系 结构 ? 
c. 该 体系 结构 是 否 有 一 个 或 多 个 数据 集 市 ?如果 有 ， 那 么 这 些 数 据 集 市 是 依赖 的 还 是 独 
立 的 ? 
d. 终端 用 户 采 用 何 种 工具 ? 是 否 采用 了 数据 挖掘 工具 ? 
.在 开发 数据 仓库 环境 时 必须 克服 哪些 障碍 和 困难 ? 

2. 访问 如 下 因特网 站 点 。 浏 览 这 些 站 点 以 了 解 关 于 数据 仓库 的 其 他 信息 ， 其 中 包括 数据 仓 

库 实 现 的 实例 ， 最 新 的 数据 仓库 产品 的 描述 ， 有 关 会 议和 其 他 事件 的 通告 。 
a. International Data Warehouse Association: http://www. idwa.com 
b. The Data Warehousing Institute: http:/www. dw-institute.com 


© 


c¢. Knowledge Discovery Mine: http://www.kdnuggets.com 
d. Data Mining Institute: http:/www. datamining.org 


e. Data Warehousing Knowledge Center: http://www. datawarehousing.org 
f. 一 份 数据 仓库 的 电子 期 刊 : http:/ www.tdan.com 
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项 目 案例 : 山 景 社区 医院 


项 目 描述 

在 很 多 方面 ， 山 景 社区 医院 遵循 仔细 的 规划 方法 进行 了 信息 系统 的 设计 、 选 择 和 安装 。 该 
组 织 已 经 开发 了 一 个 企业 数据 模型 来 指导 它 的 数据 库 开 发 (参见 第 3 章 和 第 4 童 )。 而 且 ， 医 院 
已 经 安装 了 计算 机 系统 支持 组 织 的 日 常 运 作 。 例 如 ， 医 院 已 经 有 病人 账目 系统 、 管 理 服务 系统 
和 财务 管理 系统 。 这 些 系统 大 多 是 经 过 仔细 的 考察 最 终 从 外 部 供应 商 那 里 购 头 的 。 

尽管 经 过 仔细 的 规划 ， 管 理 层 还 是 发 现 现 有 的 医院 信息 系统 存在 一 些 不 足 和 限制 。 已 经 引 
起 注意 的 两 个 典型 问题 是 : 

1) 数据 在 不 同 的 文件 和 数据 库 中 经 常 以 不 同 的 格式 其 至 在 不 同 的 媒介 上 发 生 重复 。 例 如 ， 
由 于 记 账 的 需要 ， 一 组 病人 数据 保存 在 基于 关系 数据 库 的 病人 账目 系统 中 ， 但 同时 ， 大 多 数 病 
人 的 病历 又 保存 在 一 个 人 工 系统 中 (每 个 病人 一 个 文件 夹 ) 。 

2) 系统 主要 用 来 支持 运作 (事务) 处理、 但 随 着 现代 医院 在 管理 方面 需求 的 增加 ， 该 系统 
不 能 再 提供 管理 信息 或 支持 分 析 研 究 。 

通常 ， 医 疗 行业 (包括 像 山 景 社区 医院 这 样 的 医院 ) 是 靠 获得 更 好 和 更 多 的 对 其 临床 、 运 
作 和 财务 信息 的 集中 化 访问 来 推动 的 (Griffin，1997)。 典 型 的 医院 数据 仓库 可 能 包含 四 种 类 
型 的 数据 : 病人 记录 ; 医生 、 门 诊 和 医院 记录 ; 药品 及 制药 公司 记录 ; HMO 和 保险 公司 记录 
(Martin，1997b ) 。 

为 了 解决 上 述 问 题 ， 山 景 社区 医院 的 管理 者 想 调查 一 下 数据 仓库 技术 是 否 能 成 功 地 应 用 于 
他 们 的 组 织 。 因 为 医院 比较 小 ， 所 以 他 们 认为 开发 一 个 大 型 数据 仓库 并 不 合适 。 不 过 ， 他 们 还 
是 想 开发 一 个 小 的 原型 来 证 明 这 个 想法 是 否 可 以 实现 。 在 进行 了 一 些 调研 之 后 ， 他 们 决定 开发 
两 个 规模 较 小 的 原型 数据 集 市 : 

1) 一 个 数据 集 市 用 来 记录 医院 里 医生 所 执行 的 检查 和 步骤 的 汇总 信息 。 

2) 另外 一 个 比较 详细 的 数据 集 市 记录 医生 对 某 个 病人 所 执行 的 检查 和 步骤 的 细节 。 

项 目 问题 

D 山 景 社区 医院 利用 数据 仓库 或 数据 集 市 可 以 获得 哪些 好 处 ? 

2) 假定 医院 决定 采用 星 型 模式 开发 一 个 数据 集 市 。 请 列举 几 种 你 认为 在 该 模式 中 应 该 具有 
的 维度 。 

3) 正如 上 面 所 提 到 的 ， 山 景 社区 医院 在 没有 建 好 数据 仓库 的 前 提 下 考虑 开发 数据 集 市 ， 你 
认为 这 种 方式 合适 吗 ? 这 样 做 有 哪些 风险 ”你 认为 一 个 组 织 在 没有 建 好 数据 仓库 的 前 提 下 ， 能 
够 通过 开发 原型 数据 集 市 来 验证 某 种 想法 吗 ” 讨论 该 方法 的 优点 和 缺点 。 

项 目 练习 

(1) 汇总 数据 集 市 

a. 设计 一 个 星 型 模式 : 

Physician 维 度 : 

Physician_ID (pk): 5 字 节 
Physician_Name: 10 字 节 
Specialty: 5$ 字 节 
Physician_Address: 10 字 节 
Physician_Telephone: 5 字 节 

Treatment 维 度 : 
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Treatment_ID (pk): 3 字 节 
Treatment_Description: 6 字 节 
Period 维 度 : 
Period_ID (pk): 2 字 节 
Month: 1 字 节 
Year: 2 字 节 
Treatment (事实 ) 表 : 
粒度 : 按 医生 和 治疗 对 每 月 的 治疗 与 平均 治疗 成 本 进行 汇总 。 
Monthly_Total: 3 字 节 。 
Average_Cost: 5 字 节 。 
b. 估算 事实 表 的 行 数 和 大 小 (以 字 节 为 单位 )。 假 定 : 
1) Treatment: 医院 大 概 执行 5300 种 不 同 的 冶 疗 。 在 -- 个 月 内 ， 大 概 执 行 了 30% (150 种 ) 的 
治疗 种 类 。 
2) Physicians: 每 次 治疗 由 一 位 医生 进行 。 
3) Periods: 如 果 开 发 一 个 全 面 的 数据 集 市 ， 可 以 考虑 察 合 36 个 时 间 段 (3 年 ) 的 数据 。 
(2) 详细 数据 集 市 
a. 设计 一 个 星 型 模式 。 
Physician 维 度 : 同上 。 
Treatment 维 度 : 同上 。 
Period 维 度 : 
Period_ID (pk): 3 字 节 
Date: 5 字 节 
Patient 维 度 : 
Patient_ID (pk): 5 字 节 
Patient_Name: 10 字 节 
Patient_Address: 10 字 节 
Patient_Telephone: 5 字 节 
Treatment (事实 ) 表 : . 
粒度 : 一 位 医生 对 一 位 病人 所 做 的 每 次 治疗 。 
Treatment _Cost: 4 字 节 
Treatment _Result: 20 字 节 。 
Doctor_Order: 10 字 节 。 
b. 估算 事实 表 的 行 数 和 大 小 (以 字 节 为 单位 )。 假 定 : 
1) Treament。 一 天 中 针对 病人 进行 平均 200 种 治疗 ( 每 天 统计 的 平均 病人 是 100 名 ， 并 且 每 
个 病人 每 天 平均 做 两 种 治疗 )。 
2) Patients。 每 次 对 一 位 病人 进行 治疗 。 为 了 简单 起 见 ， 假 定 在 某 一 天 里 一 种 指定 的 治疗 
只 能 由 一 位 医生 对 一 位 病人 进行 。 
3) Physicians。 每 次 治疗 由 一 位 医生 进行 。 
4) Periods: 如 有 果 开 发 一 个 全 面 的 数据 集 市 ， 可 以 考虑 收集 大 概 1000 天 (3 年 ) 的 数据 。 
c. 为 什么 必须 假定 在 某 一 天 里 一 种 治疗 只 能 由 一 位 医生 对 -- 位 病人 进行 一 次 ?请 提出 解决 
这 种 限制 的 方法 。 





第 二 部 分 ~ 第 四 部 分 已 为 读者 开发 高 效 实用 的 数据 库 资 定 了 基础 ， 第 五 部 分 则 补充 介绍 一 
些 重要 的 数据 库 设 计 与 管理 问题 。 这 些 问 题 包括 数据 库 安全 性 、 备 份 与 恢复 、 对 数据 并 发 访 
问 的 控制 、 数 据 质量 的 维护 、 数 据 库 性 能 调整 的 高 级 主题 ， 以 及 当代 最 热门 的 两 个 数据 库 主 
题 分 布 式 数据 库 和 面向 对 象 数 据 库 。 第 五 部 分 后 面 的 四 个 附录 包括 其 他 E-R 表 示 方 法 、 高 
级 范式 (补充 第 5 章 )、 数 据 结 构 (补充 第 6 章 ) 和 对 象 关系 数据 模型 (补充 第 5 章 与 第 14 章 )。 

读 过 本 书 ， 读 者 会 发 现 ， 和 人 人力、 物质 资源 以 及 财务 资源 都 是 企业 资产 一 样 ， 数 据 也 是 一 
种 企业 资产 。 因 此 ， 数 据 和 信息 都 是 不 能 随便 处 理 的 极 有 价值 的 资源 。 在 第 12 章 里 ， 读 者 将 学 
到 数据 与 数据 库 管 理 的 关键 性 信息 资源 管理 活动 ,还 将 学 到 并 发 性 控制 、 死 锁 、 加 密 、 信 息 库 、 
加 锁 、 恢 复 、 系 统 目 录 、 事 务 和 版 本 设置 的 意义 ， 还 将 学 到 下 列 两 类 角色 的 作用 : 

*。 数据 管理 员 总 体 负责 数据 、 元 数据 及 数据 使 用 策略 的 人 员 。 

。 数 据 库 管理 员 一 一 负责 物理 数据 库 设 计 和 处 理 诸 如 实施 安全 性 、 数 据 库 性 能 、 备 份 与 恢 

复 以 及 与 管理 数据 库 有 联系 的 技术 问题 的 人 员 。 

数据 管理 与 数据 库 管理 活动 贯穿 于 数据 库 开 发 的 全 过 程 。 数 据 管理 员 在 数据 库 开 发 的 早期 
阶段 以 及 数据 资源 的 整体 规划 中 起 到 重要 的 作用 ， 而 数据 库 管 理 员 则 在 物理 数据 库 的 设计 、 实 
现 与 操作 中 起 着 重要 作用 。 

在 一 些 大 型 的 组 织 里 ， 数 据 库 可 能 分 布 于 多 人 台 计 算 机 和 多 个 位 置 。 当 一 个 组 织 机 构 试图 以 
单个 数据 库 方 式 而 不 是 以 多 个 分 散 、 单 独 的 数据 库 方 式 管理 分 布 数据 时 ， 就 会 出 现 一 些 特殊 的 
问题 。 在 第 13 章 里 ， 读 者 将 学 到 同 构 或 异 构 分 布 式 数据 库 、 分 布 式 数据 库 的 目标 与 权衡 ， 以 及 
分 布 式 数据 库 的 几 种 可 用 的 体系 结构 。 除 此 之 外 ， 读 者 还 将 学 到 数据 复制 、 数 据 分 区 以 及 如 何 
使 一 个 分 布 式 数据 库 上 的 同一 个 数据 的 多 个 实例 同步 等 重要 概念 ， 还 将 学 到 包括 分 布 式 事务 控 
制 ( 如 提交 协议 ) 在 内 的 分 布 式 数据 库 管理 系统 的 特点 。 另 外 ， 还 将 介绍 分 布 式 数据 库 管理 系 
统 的 演变 和 分 布 式 数据 库 管理 系统 产品 范围 。 

第 14 章 引入 了 另 一 种 E-R 建 模 技术 。 面 向 对 象 数据 模型 和 男 一 些 系统 方向 越 来 越 受 欢迎 ， 
因为 它们 可 以 通过 高 度 相 关 的 建 模 表示 方法 来 表达 复杂 的 思想 。 本 章 采 用 统一 建 模 语言 
(Unified Modeling Language，UML )， 它 是 该 领域 的 一 种 标准 。 在 UML 里 ， 所 谓 对 象 就 是 一 个 
实体 ， 它 包含 有 三 个 属性 : 状态 、 行 为 与 标识 。 一 个 对 象 的 行为 是 通过 封装 在 该 对 象 里 的 一 个 
或 多 个 操作 来 加 以 确定 的 。 关 联 、 概 化 、 继 承 与 多 态 都 是 重要 的 概念 。 本 章 对 第 3 章 的 松 谷 家 
有 具 公司 案例 ， 采 用 类 图 形式 来 描述 其 面向 对 象 的 版 本 。 

第 15 章 阐述 将 类 图 转换 为 模式 的 方法 ， 它 可 以 利用 对 象 数据 库 管 理 系 统 (ODBMS ) 来 实 
现 ， 该 章 还 介绍 了 对 象 定义 语言 (ODL) 和 对 象 查询 语言 (OQL )。 读 者 将 学 到 如 何在 ODL 里 
创建 面向 对 象 数据 库 定 义 ， 包 括 如 何 定义 对 象 、 属 性 、 操 作 与 联系 ; 并 将 学 到 与 SQL 类 似 的 
OQL 初 步 知 识 ， 包 括 单 表 或 多 表 查 询 。 











第 12 章 ”数据 管理 与 数据 库 管 理 


12.1 学 习 目 标 
学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 
* 定义 下 列 关键 术语 : 数据 管理 、 数 据 库 管 理 、 数 据 库 安 全 性 、 加 密 、 数 据 库 恢复 、 事 务 、 
并 行 控制 、 加 锁 、 死 锁 、 版 本 设置 、 系 统 目 录 和 信息 库 。 
“列举 数据 管理 与 数据 库 管 理 的 一 些 主要 功能 。 
* 描述 在 现代 业务 环境 下 数据 管理 员 和 数据 库 管理 员 作用 的 变化 。 
* 描述 数据 词典 和 信息 库 的 作用 以 及 如 何在 数据 管理 中 利用 它们 。 
* 比较 并 发 性 控制 的 乐观 系统 与 悲观 系统 。 
* 描述 数据 库 的 安全 性 问题 ， 并 列举 加 强 安全 性 常用 的 五 种 技术 。 
“描述 数据 库 恢复 问题 ， 并 列举 在 DBMS 中 恢复 数据 库 常 用 的 四 种 基本 工具 。 
“描述 调整 数据 库 以 达到 较 好 性 能 的 问题 ， 并 列举 在 调整 数据 库 时 可 能 发 生变 更 的 五 个 
方面 。 
12.2 引言 


现在 很 多 人 已 经 认识 到 数据 对 于 组 织 有 极为 重要 的 作用 。 正 如 人 力 、 物 质 资 源 与 财务 资源 
都 是 企业 资产 一 样 ， 数 据 也 是 企业 的 一 项 资产 。 因 此 ， 数 据 与 信息 是 极 有 价值 的 资源 ， 不 能 轻 
率 地 处 理 它们 。 信 息 技术 的 开发 极 大 地 提高 了 管理 企业 数据 的 效率 ， 人 们 已 经 开发 出 有 助 于 组 
织 达 到 有 效 管理 数据 目标 的 数据 管理 活动 。 有 效 的 数据 管理 可 以 为 组 织 中 各 部 门 制定 管理 性 决 
策 提供 支持 。 

男 一 方面 ， 数 据 管理 的 低 效 性 将 导致 数据 利用 率 低 ， 可 以 用 许多 组 织 中 最 常见 的 下 列 状况 
来 刻画 低 效 的 数据 管理 : 

1) 同一 数据 项 的 多 重 定义 或 不 同 数据 库 中 同一 数据 元 素 的 不 一 致 表示 (使 得 集成 不 同 数据 
库 时 产生 较 大 的 风险 )。 

2) 关键 数据 元 素 缺失 (这 一 缺失 会 使 现 有 数据 失去 价值 )。 

3) 使 用 不 合适 的 数据 源 或 者 从 一 个 系统 向 另 一 个 系统 传输 数据 的 时 机 不 当 会 引起 数据 质量 
水 平 低下 (这 会 降低 数据 的 可 靠 性 )。 

4) 对 现 有 数据 缺乏 了 解 ， 包 括 不 熟悉 数据 所 在 位 置 和 所 存储 数据 的 意义 (这 会 降低 利用 数 
据 作 出 有 效 战略 、 规 划 决 策 的 能 力 )。 

5) 差 的 及 不 可 容忍 的 查询 响应 时 间 、 频 繁 的 数据 库 停机 、 没 有 正确 地 控制 数据 的 保密 性 与 
安全 性 。 

许多 组 织 已 经 采取 各 种 策略 来 处 理 这 些 数据 利用 问题 。 有 些 公司 利用 一 种 称 为 数据 管理 
(data administration ) 的 功能 。 负责 实现 这 一 功能 的 人 被 称 为 数据 管理 员 或 者 信息 资源 经 理 ， 
他 们 负责 数据 资源 的 总 体 管理 。 第 二 种 功能 即 数据 库 管理 (database administration ) ， 主 要 负 
责 物理 数据 库 设计 和 处 理 诸如 实施 安全 性 、 数 据 库 性 能 、 备 份 与 恢复 以 及 与 数据 库 管理 有 关 的 
各 种 技术 问题 。 有 些 组 织 则 结合 使 用 数据 管理 与 数据 库 管理 功能 。 随 着 商业 步伐 的 加 快 ， 数 据 
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管理 员 (DA) 与 数据 库 管 理 员 (DBA) 的 作用 也 在 发 生 改 变 ， 这 就 是 我 们 要 在 下 一 节 讨 论 的 
内 容 。 


12.3 数据 管理 员 与 数据 库 管理 员 的 作用 


有 两 个 因素 驱使 数据 管理 与 数据 库 管理 的 作用 不 断 发 生变 化 : 一 是 许多 组 织 已 经 可 以 利用 
更 多 的 技术 与 平台 ,但 它们 必须 并 发 地 进行 管理 ; 二 是 业务 变革 的 速度 不 断 加 快 ( 见 Quintan， 
1996)。 面 对 这 些 变化 ， 理 解数 据 管理 和 数据 库 管理 的 作用 至 关 重 要 。 这 将 有 助 于 理解 具有 不 
同 信息 技术 体系 结构 的 各 个 组 织 ， 是 通过 怎样 的 途径 来 综合 利用 这 些 角 色 的 。 

12.3.1 传统 的 数据 管理 

数据 库 是 属于 整个 企业 的 共享 资源 ， 它 们 并 非 是 组 织 内 某 个 人 或 者 某 个 部 门 的 私有 财产 。 
正如 财务 总 监 是 财务 资源 的 监管 人 一 样 ， 数 据 管理 就 是 组 织 中 数据 的 监管 人 。 与 财务 总 监 相仿 ， 
数据 管理 员 必须 开发 出 各 种 过 程 来 检测 与 控制 数据 资源 。 此 外 ， 数 据 管理 必须 解决 数据 由 用 户 
集中 使 用 或 者 共享 时 可 能 会 出 现 的 各 种 问题 ; 还 必须 决定 数据 存储 与 管理 的 方案 。 数 据 管理 是 
负责 组 织 里 数据 资源 的 总 体 管理 的 一 种 高 级 功能 ， 其 中 包括 维护 全 公司 的 数据 定义 与 标准 。 

数据 管理 的 职责 范围 相当 大 ， 包 括 数 据 库 的 规划 、 分 析 、 设 计 、 实 现 、 维 护 与 保护 。 数 据 
管理 还 负责 建立 改善 数据 库 性 能 的 过 程 ， 并 向 用 户 提供 教育 、 培 训 及 咨询 服务 的 支持 。 数 据 管 
理 员 必须 要 同 高 级 管理 层 、 用 户 以 及 计算 机 应 用 专家 打交道 。 

选择 数据 管理 员 并 组 织 好 其 管理 职能 极其 重要 。 一 个 组 织 在 进行 较 大 的 变革 时 通常 会 遇 到 
各 种 问题 ， 数 据 管理 员 必须 是 能 够 解决 这 些 问题 的 经 验 丰 富 的 管理 人 员 。 数 据 管理 员 应 该 是 从 
组 织 内 选拔 出 来 的 有 一 定 威望 的 高 级 管理 人 员 ， 不 提倡 聘用 只 慌 技 术 的 计算 机 专家 或 者 新 手 来 
担任 此 职 。 

数据 管理 部 门 的 经 理 既 要 有 丰富 的 管理 经 验 ， 又 要 有 相当 的 技术 能 力 。 一 方面 ， 他 必须 能 
够 协调 拒绝 将 其 私有 数据 提供 出 来 作为 共享 数据 的 用 户 ; 并 必须 使 这 些 用 户 确 信 ， 对 于 访问 数 
据 库 来 说 ， 遵 循 标准 的 定义 与 过 程 会 带 来 极 大 的 好 处 。 另 一 方面 ， 数 据 管理 员 又 必须 能 够 管理 
那些 负责 处 理 查询 优化 和 并 发 控制 等 问题 的 技术 人 员 。 

12.3.2 传统 的 数据 库 管 理 

通常 情况 下 ， 数 据 库 管理 角色 往往 更 为 直接 地 在 物理 上 接触 一 个 或 多 个 数据 库 。 数 据 库 管 
理 是 一 种 技术 性 职能 ， 它 负责 物理 数据 库 的 设计 ， 并 处 理 诸如 实施 安全 性 、 数 据 库 性 能 以 及 备 
份 与 恢复 等 技术 问题 。 数 据 库 管理 员 应 当 参 与 到 数据 库 开 发 的 每 一 个 阶段 里 ， 从 数据 库 规 划 到 
分 析 、 设 计 与 实现 阶段 ， 并 完成 具体 的 操作 、 维 护 和 修改 。DBA 必 须 贯彻 执行 由 数据 管理 员 所 
制定 的 标准 和 步 又 ， 包 括 强制 性 编程 标准 、 数 据 标准 、 策 略 及 步 旺 。 有 些 组 织 里 ， 数 据 库 管 理 
这 一 职能 并 没有 完全 独立 出 来 ，DBA 还 必须 承担 数据 管理 员 的 职责 。 

与 数据 管理 员 一 样 ，DBA 也 要 有 丰富 的 工作 经 验 。 最 主要 的 是 要 有 扎实 的 技术 背景 ， 包 括 
当前 流行 的 硬件 体系 结构 与 功能 的 渊博 知识 ， 以 及 对 数据 处 理 有 深入 的 理解 。 理 解 包括 传统 方 
法 和 原型 方法 在 内 的 数据 库 开发 生命 周期 ， 也 是 很 有 必要 的 。 在 概念 、 逻 辑 和 物理 层次 上， 都 
需要 有 较 强 的 设计 和 数据 建 模 能 力 。 然 而 ， 管 理性 技能 也 是 很 重要 的 ， 因 为 DBA 在 分 析 、 设 计 
和 实现 数据 库 时 必须 管理 其 他 信息 系统 人 员 ， 而 且 DBA 还 必须 面 对 许 多 最 终 用 户 ， 并 向 他 们 提 
供 有 关 数 据 库 的 设计 和 使 用 方面 的 服务 支持 。 

12.3.3 数据 管理 与 数据 库 管理 方法 的 演化 

目前 还 没有 所 有 人 普遍 接受 的 数据 管理 和 数据 库 管理 结构 ， 而 且 各 个 组 织 的 数据 管理 方法 

也 不 尽 相同 。 随 着 业务 实践 改变 ， 其 角色 作用 在 组 织 内 也 会 发 生 改 变 。 然 而 ， 不 管 组 织 结构 如 
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何 ， 总 会 存在 一 组 核心 的 数据 管理 与 数据 库 管理 功能 ， 它 们 在 任何 组 织 内 都 会 存在 。 这 些 功能 
很 可 能 由 各 个 数据 管理 员 和 数据 库 管理 员 来 负责 ， 或 者 在 极端 情况 下 ， 所 有 这 些 功能 可 能 仅 是 
由 某 一 个 人 来 处 理 。 其 中 一 些 功能 是 组 组 层次 的 功能 ， 人 全 ] 倾 向 于 把 它们 归 类 为 组 织 的 数据 管 
理 功能 ， 以 示 数 据 管理 和 数据 库 管理 之 间 有 所 区 别 。 另 一 些 功能 对 于 数据 库 或 者 应 用 软件 来 说 
更 为 专门 些 ， 因 此 把 它们 归 类 于 数据 库 管理 功能 。 不 过 ， 要 进行 有 效 的 数据 与 数据 库 管理 ， 必 
须要 处 理 以 下 一 些 功能 : 
* 数据 的 策略 、 过 程 与 标准 每 个 数据 库 应 用 软件 都 需要 通过 实施 一 致 的 数据 策略 、 过 程 和 
标准 来 建立 保护 措施 。 数 据 策略 是 明确 数据 管理 目标 的 语句 ， 如 “每 个 用 户 必须 有 一 个 
口令 "。 数 据 过 程 就 是 编写 为 完成 特定 的 活动 所 采取 行为 的 概述 。 例 如 ， 备 份 与 恢复 过 程 
应 该 与 所 有 相关 员工 进行 通信 。 数 据 标准 是 -- 些 必须 遵循 的 明确 的 约定 和 行为 ， 它 们 可 
以 用 于 帮助 评估 数据 库 质量 。 例 如 ， 对 于 程序 员 来 说 ， 数 据 库 对 象 的 命名 规则 应 当 是 标 
准 化 的 。 同 时 ， 外 部 数据 源 使 用 的 增加 和 来 自 组 织 外 部 对 组 织 数据 库 访问 的 增加 ， 也 促 
使 员工 认识 到 理解 数据 策略 、 过 程 和 标准 的 重要 性 。 
"规划 ”涉及 开发 组 织 的 信息 体系 结构 的 -- 项 关键 性 管理 功能 。 有 效 的 管理 既 需 要 理解 组 织 
对 信息 的 要 求 ， 又 要 有 开发 符合 组 织 的 众多 要 求 的 信息 体系 结构 的 能 力 。 完 成 数据 和 数据 
库 管理 的 关键 是 ， 理 解 该 组 织 的 信息 需求 ， 并 使 信息 体系 结构 的 开发 与 组 织 需求 相 吻合 。 
“ 数据 冲突 的 化 解 数据 库 应 该 是 共享 的 ， 而 且 通 常 都 是 涉及 该 组 织 多 个 不 同 的 部 门 。 在 任 
何 组 织 里 ， 确 定数 据 的 所 有 权 往往 是 一 个 坏 手 的 问题 (至 少 有 时 候 是 这 样 )。 在 数据 和 数 
据 库 管理 中 ， 要 善于 化 解数 据 所 有 权 问 题 ， 因 为 它们 并 非 只 同 某 个 部 门 相关 联 。 化 解 这 
类 冲突 时 ， 最 重要 就 是 建立 相应 的 过 程 。 只 要 在 化 解 冲突 时 ， 管 理 功能 能 得 到 充分 的 授 
权 来 进行 调解 和 强化 ， 那 么 数据 和 数据 库 管理 在 处 理 这 类 问题 时 是 非常 有 效 的 。 
* 内 部 营销 尽管 组 织 已 经 充分 意识 到 数据 和 信息 对 于 它们 的 重要 性 ， 然 而 却 未 必 会 意识 到 
与 其 有 关 的 数据 标准 的 重要 性 。 以 下 确立 的 过 程 和 政策 的 重要 性 ， 必 须 预 先 通过 数据 和 
数据 库 管理 员 告知 整个 机 构 。 有 效 的 内 部 营销 可 以 减少 变革 的 阻力 和 数据 所 有 权 问题 。 
* 信息 库 的 管理 ”信息 库 包含 描述 组 织 数据 和 数据 处 理 源 的 元 数据 。 在 很 多 组 织 里 ， 信 息 
库 用 来 替代 数据 词典 。 然 而 ， 数 据 词典 只 是 简单 的 数据 元 素 文档 工具 ， 可 是 信息 库 却 能 
被 数据 管理 员 和 其 他 的 信息 专家 用 来 管理 整个 信息 处 理 环境 。 信 息 库 是 数据 和 数据 库 管 
理 的 一 种 基本 工具 ， 并 在 整个 数据 库 系统 生命 周期 中 应 用 。 信 息 库 可 以 用 作为 下 述 对 象 
的 信息 源 : 
D 用 户 (必须 理解 数据 定义 、 业 务 规则 和 数据 对 象 之 间 的 联系 )。 
2) 自动 化 CASE 工 具 (用 来 规定 与 开发 信息 系统 )。 
3) 应 用 软件 (访问 或 者 操纵 企业 数据 库 中 的 数据 或 业务 信息 )。 
4) 数据 库 管理 系统 (维护 该 信息 库 并 更 新 系统 权限 、 口 令 、 对 象 定义 等 )， 
“硬件 与 软件 的 选择 “硬件 与 软件 的 评估 与 选择 对 于 一 个 组 织 的 成 功 至 关 重 要 。 新 型 软 硬 件 
开发 速度 的 加 快 和 组 织 内 的 快速 变革 ， 使 选择 的 标准 日 渐 细 化 。 在 选择 平台 时 ， 某 个 供 货 
商 的 数据 库 似乎 是 最 合适 的 产品 ; 但 一 旦 其 竞争 对 手 发 行 了 一 种 不 同 的 但 具有 更 加 合适 的 
功能 的 新 版 本 ， 那 么 原先 的 选择 就 显得 极 不 适用 。 现 行 的 供 货 商 其 至 于 可 能 已 经 脱离 了 业 
务实 际 ， 导 致 生产 数据 库 中 的 维护 工作 简直 就 像 是 一 场 虐 梦 。 人 们 越 来 越 娶 望 数据 管理 员 
和 数据 库 管理 员 能 够 了 解 更 多 的 硬件 体系 结构 ， 并 且 既 能 管理 自行 开发 出 来 的 应 用 软件 ， 
也 能 管理 商业 现 用 的 应 用 软件 ， 因 为 组 织 总 是 力求 更 加 快速 地 满足 自己 的 信息 要 求 。 
“DBMS 的 安装 与 升级 一 旦 选 定 了 DBMS， 就 必须 进行 安装 。 在 安装 之 前 ， 应 当 在 DBMS 
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供 货 商 所 提供 的 计算 机 上 运行 其 数据 库 工 作 负载 的 特征 指标 。 在 实际 安装 时 必须 考虑 到 

特征 指标 的 期 望 问题 (在 选择 软 硬 件 时 也 可 以 用 特征 指标 来 比较 竞争 对 手 的 产品 ) 。 

DBMS 安 装 是 一 个 很 复杂 的 过 程 ， 安 装 时 要 确保 各 个 模块 的 正确 的 版 本 都 正确 安装 ， 所 

有 的 设备 驱动 程序 已 正确 安装 ， 以 及 DBMS 能 够 与 任何 第 三 方 软件 产品 协同 工作 。 

DBMS 供 货 商 会 定期 地 更 新 其 软件 包 模块 ; 制定 测试 计划 并 安装 升级 ， 以 确保 现 有 的 应 

用 软件 仍然 能 正确 地 工作 ， 这 项 工作 可 能 很 花费 时 间 并 且 很 复杂 。 一 旦 安装 好 DBMS ， 

就 必须 要 创建 并 维护 好 用 户 的 账户 。 

“数据库 性 能 调整 由 于 数据 库 是 动态 的 ， 因 此 、 希 望 数 据 库 的 最 初 设计 就 能 确保 它 在 整个 

生命 期 内 都 能 达到 最 佳 处 理性 能 是 不 现实 的 。 应 该 对 数据 库 的 性 能 (查询 与 更 新 的 处 理 

计 间 以 及 数据 存储 利用 率 ) 持续 进行 监控 。 数 据 库 的 设计 必须 不 断 变更 ， 以 迎合 新 的 需 

求 并 克服 多 次 内 容 更 新 所 带 来 的 退化 效应 。 数 据 库 应当 定 期 地 加 以 重建 、 重 组 织 和 重 索 

31， 以 便 恢 复 浪费 的 空间 、 校 正 不 良 的 数据 分 配 和 存储 设备 的 分 段 、 为 并 发 处 理 分 配 不 

问 的 缓 促 空间 以 及 重新 设 定 参 数 来 定义 最 佳 的 恢复 过 程 。DBMS 所 需要 的 不 包含 业务 数 

据 的 各 种 系统 表 ， 也 需要 定期 地 加 以 重建 ， 以 便 能 与 数据 库 的 新 的 使 用 和 规模 相 一 致 。 

* 数据 库 查 询 处 理性 能 的 改善 ”一 个 数据 库 的 工作 负载 绝 大 多 数 是 会 随时 间 不 断 增加 的 ， 

因为 越 来 越 多 的 用 户 找到 了 更 多 的 办 法 在 数据 库 中 使 用 不 断 增 长 的 数据 。 因 此 ， 有 些 查 

询 原 先 在 一 个 小 型 数据 库 上 运行 得 很 快 ， 但 在 某 个 有 许多 用 户 使 用 的 数据 库 上 ， 要 想 获 

得 满意 的 运行 时 间 ， 就 必须 将 其 改写 成 一 种 更 有 效 的 形式 。 可 能 需要 追加 或 删除 索引 ， 

以 便 平衡 所 有 查询 的 性 能 。 也 可 能 要 将 数据 重新 定位 到 其 他 设备 上 ， 以 便 更 快 地 执行 查 

询 与 更 新 的 并 发 处 理 。 有 争议 的 是 ， 一 个 DBA 是 否 需要 花费 大 量 的 时 间 来 调整 数据 库 的 

性 能 和 改善 数据 库 查 询 的 处 理 时 间 。 

“ 数据 安全 性 、 私 密 性 与 完整 性 的 管理 数据 库 管理 还 要 负责 组 织 数据 库 的 安全 性 、 私 密 性 

与 完整 性 。 关 于 确保 私密 性 、 安 全 性 和 完整 性 的 方法 的 内 容 将 在 本 章 后 面部 分 介绍 。 这 

里 重要 的 是 理解 由 于 因特网 和 企业 内 部 网 的 出 现 ， 再 加 上 将 数据 和 数据 库 分 布 到 多 个 站 

点 的 可 能 性 ， 使 得 数据 安全 性 、 私 密 性 和 完整 性 的 管理 变 得 更 加 复杂 。 

“ 数据 备份 与 恢复 DBA 必 须 确保 已 经 确立 备份 过 程 ， 以 便 可 以 恢复 所 有 必要 的 数据 ， 不 

至 于 在 出 现 应 用 软件 故障 、 硬 件 故 障 、 物 理 或 电气 灾难 、 人 为 错误 或 者 渎职 犯罪 时 琉 失 

数据 。 本 章 后 面 也 将 会 讨论 常用 的 备份 和 恢复 的 策略 。 这 些 策略 必须 以 一 定 的 时 间 间 隔 

进行 充分 的 测试 和 评估 。 

了 解 这 些 数 据 和 数据 库 管理 功能 ， 可 以 使 读者 了 解 在 组 织 层次 和 项 目 层次 进行 数据 管理 的 
重要 性 。 不 采取 这 些 真正 的 步 难 ， 就 可 能 会 大 大 降低 组 织 的 有 效 运作 的 能 力 ， 黄 至 于 可 能 造成 
业务 尖 败 。 对 于 减少 应 用 软件 开发 时 间 的 要 求 始终 必须 经 过 审查 ， 以 便 在 时 间 急 迫 时 仍然 不 至 
于 已 记 确 保 必 要 的 质量 ;对 于 这 类 捷径 ， 最 好 要 有 严格 的 复审 。 图 12-1 对 数据 管理 和 数据 库 管 
理 功 能 按照 典型 的 系统 开发 阶段 进行 介绍 。 

12.3.4 数据 管理 方法 的 演化 : 

许多 组 织 现 在 都 把 数据 管理 和 数据 库 管理 的 角色 作用 结合 在 一 起 。 这 些 组 织 关注 的 是 快速 
建立 数据 库 的 能 力 ， 调 整数 据 库 使 其 达到 最 大 性 能 以 及 能 够 在 问题 出 现时 迅速 解决 它 的 能 力 。 
这 些 数据 库 很 可 能 就 是 部 门 性 的 客户 /服务 器 数据 库 ， 它 们 可 以 采用 原型 法 之 类 较 新 的 开发 方法 
快速 开发 出 来 ， 这 些 方法 可 以 作出 某 些 快速 的 改变 。 将 数据 管理 和 数据 库 管理 作用 结合 起 来 也 
意味 着 ， 这 些 组 织 中 的 DBA 必 须 能 够 创建 和 实施 数据 标准 与 策略 。 在 这 种 环境 下 ， 要 求 DBA 迅 
束 交 付 高 质量 、 强 壮 的 系统 。 在 组 织 中 ， 一 方面 要 求 DBA 维 护 数据 库 使 之 保持 所 需 的 质量 水 平 ， 
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DA = 通常 由 数据 管理 员 完 成 
DBA= 通 常 由 数据 库 管 理 员 完 成 


图 12-1 数据 管理 和 数据 库 管理 的 功能 


DA 


DBA 


DA/DBA 


DBA 


DA/DBA 


DBA 


DA/DBA 





各 12 赣 ”数据 每 理 与 数据 亩 和 营 理 409 





另 -方面 要 以 更 短 的 时 间 构 建 可 靠 的 系统 。Quinlan(1996) 建 议 对 数据 管理 和 数据 库 管理 实践 作 
某 些 改变 ， 这 些 改变 可 以 在 传统 数据 库 开发 生命 周期 的 每 一 个 阶段 完成 ， 以 实现 上 述 目 标 : 

。 数据库 规划 ”通过 有 选择 地 评估 可 能 产品 的 方式 来 改进 对 技术 的 选择 。 要 确保 考虑 了 与 

企业 数据 模型 相符 合 的 每 种 技术 ， 在 数据 库 规划 阶段 仔细 选择 所 用 技术 可 以 搜索 寻找 出 

减少 以 后 阶段 所 需要 时 间 的 途径 。 

。 数据库 分 析 ”尝试 让 物理 设计 与 逻辑 、 物 理 模 型 的 开发 并 行 完 成 。 现 在 ， 利 用 应 用 软件 

原型 方法 可 以 顺利 地 在 开发 过 程 中 对 原先 的 逻辑 、 物 理 数据 模型 作 变更 。 

* 数据 库 设计 ”可 以 按照 量 、 重 要 性 和 复杂 性 对 应 用 软件 事务 的 优先 级 排序 。 对 于 应 用 软 

件 来 说 ， 这 些 事务 变 得 越 来 越 关 键 。 在 开发 这 些 事务 的 时 候 ， 应 当 迅 速 地 审查 一 下 它们 

的 规格 说 明 书 。 逻 辑 数据 建 模 、 物 理 数 据 建 模 和 原型 化 可 以 并 行 地 进行 。DBA 应 该 力求 

为 数据 库 环境 提供 最 合适 的 控制 ， 同 时 允许 开发 者 有 实验 的 空间 和 机 会 。 

* 数据 库 实现 ”建立 数据 库 变更 控制 过 程 ， 以 支持 而 不 是 拖延 开发 和 实现 。 只 要 有 可 能 ， 
就 将 模型 分 割 为 模块 ， 这 样 可 以 更 快 地 进行 分 析 和 实现 。 寻 找 在 不 损害 质量 的 前 提 下 能 
更 快 地 测试 系统 的 办 法 。 测 试 可 以 在 开发 的 早期 阶段 进行 ; 可 以 利用 测试 和 变更 控制 工 
具 来 建立 和 管理 测试 与 生产 环境 。 

* 操作 与 维护 ”应 当 审查 所 有 节省 时 间 的 手段 ， 以 确保 数据 库 质 量 不 受 损 害 。 要 尽 可 能 考 
虑 采用 第 二 方 工 具 和 实用 程序 ， 以 节省 工作 量 ; 其 他 的 工具 (如 Lotus Notes) 可 以 减少 
会 议 时 间 ， 从 而 也 就 节省 了 工作 时 间 。 

DBA 的 作用 还 将 会 继续 演化 。DBA 可 能 会 变 得 更 加 专业 化 ， 成 为 各 个 领域 的 专家 ， 如 分 
布 式 数据 库 / 网 络 容量 规划 DBA、 服 务 器 编程 DBA、 商业 现 用 软件 定制 DBA 或 数据 仓库 DBA 等 
(Dowgiallo 等 ，1997)。 利 用 多 个 数据 库 、 通 信 协 议 及 操作 系统 的 能 力 具 有 很 高 的 价值 。 那 些 
拥有 丰富 的 开发 经 验 ， 并 能 够 快速 适应 不 断 改 变 环境 的 DBA 们 将 会 有 较 多 的 机 会 。 现 在 的 一 些 
DBA 活 动 (如 调整 ) 将 被 通过 分 析 用 户 的 使 用 模式 来 调整 系统 的 决策 支持 系统 所 取代 。 在 大 型 
企业 中 继续 使 用 超大 规模 数据 库 (VLDB ) 的 机 会 以 及 在 小 型 、 中 型 企业 中 管理 台式 或 中 型 服 
务 器 的 机 会 依然 很 多 。 

数据 仓库 管理 

最 近 五 年 里 ， 数 据 仓库 迅速 增长 ( 见 第 11 章 )， 于 是 一 个 新 的 角色 一 一 数据 仓库 管理 员 
(DWA) 也 应 和 运 而 生 。Inmon(1999) 在 其 几 篇 论文 中 (在 其 站 点 上 可 以 找到 ) 概述 过 DWA 的 职责 。 
正如 所 预期 的 ， 关 于 DWA 角 色 有 两 个 普遍 特征 : 

1) DWA 在 数据 仓库 中 起 到 的 许多 作用 与 DA 和 DBA 相 同 ， 数据 集 市 数据 库 用 于 支持 决策 应 
用 软件 〈 而 非典 型 的 DA 与 DBA 处 理 的 是 事务 处 理应 用 软件 )。 

2) DWA 主 要 关注 来 自 许多 数据 源 的 元 数据 和 数据 (抽取 协议 、 操作 性 数据 存储 、 企 业 数 据 
仓库 ) 的 集成 和 协调 ， 这 些 分 散 管理 的 数据 源 上 的 数据 未 必 是 标准 化 的 ， 而 且 可 能 超出 了 DWA 
的 控制 范围 。 

inmon 还 提议 ，DWA 应 该 拥有 一 些 专门 的 特权 : 

“建立 与 管理 一 个 能 支持 决策 制定 应 用 软件 的 环境 。 因 而 ，DWA 特 别 关心 制定 决策 所 花费 

的 时 间 ， 而 不 关心 查询 响应 的 时 间 。 

“ 为 数据 仓库 〈 即 企业 信息 工厂 ) 建立 一 个 稳定 的 体系 结构 。 因 而 ，DWA 更 加 关心 数据 仓 

库 增长 (指数 据 量 和 用 户 数 的 扩展 ) 的 影响 ， 而 不 关心 重新 设计 现 有 的 应 用 软件 的 影响 。 

“ 回 数 据 仓库 的 数据 供应 者 和 消费 者 签订 服务 层 协议 。 因 而 ，DWA 的 工作 与 最 终 用 户 和 运 

作 系 统管 理 员 的 密切 程度 要 胜 过 DA 和 DBA， 以 便 协 调 极 为 不 同 的 目标 ， 并 监督 新 的 应 用 
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软件 的 开发 (数据 集 市 、ETL 过 程 和 分 析 服 务 )。 

这 些 职责 是 数据 管理 员 或 数据 库 管 理 员 的 常规 职责 之 外 的 职责 ， 数 据 管理 员 和 数据 库 管理 
员 的 常规 职责 包括 选择 技术 、 与 用 户 就 数据 需求 进行 交流 、 制 定性 能 与 容量 的 决策 以 及 对 数据 
仓库 需求 编制 预算 和 规划 。 

Inmon 佑 计 ，EDW 每 100GB 数 据 就 需要 有 -位 DWA。 还 可 以 按照 EDW 中 一 位 DWA 每 年 需 
要 维护 的 数据 量 进 行 度量 。 用 于 抽取 /变换 /负载 的 定制 工具 ， 通 常会 增加 所 需要 的 DWA 的 数目 。 

数据 仓库 管理 员 通 常 是 归 组 织 的 IT 部 门 管理 的 ， 但 是 他 同 营 销 部 门 及 其 他 的 业务 部 门 也 有 
较 密 切 的 关系 ， 这 些 部 门 依靠 企业 数据 仓库 的 应 用 软件 ， 比 如 客户 或 供 货 商 关 系 管理 、 销 售 分 
析 、 渠 道 管理 以 及 其 他 分 析 性 应 用 软件 。DWA 不 应 当 像 DBA 那 样 是 传统 的 系统 开发 组 织 的 一 
部 分 ， 因 为 数据 仓库 应 用 软件 的 开发 与 运作 系统 不 一 样 ， 应 该 将 数据 仓库 应 用 看 成 是 与 任何 特 
定 的 运作 系统 相 独 立 的 。 男 一 种 做 法 是 将 DWA 安 排 在 EDW 的 最 基本 的 最 终 用 户 组 织 中 ， 不 过 ， 
这 可 能 会 导致 创建 过 多 的 数据 仓库 或 数据 集 市 ， 而 不 是 创建 一 个 真正 的 可 伸缩 的 EDW。 


12.4 企业 数据 的 建 模 


在 现代 业务 环境 下 ， 当 常 要 求 DBA 迅 速 提 供 高 质量 的 系统 来 适应 变化 。 正 如 第 2 章 所 介绍 
的 ， 实 现 这 一 日 标的 关键 在 于 开发 一 个 企业 体系 结构 或 者 信息 系统 体系 结构 (ISA)。ISA 的 作者 
( 见 Zachman，1997) 认为 信息 系统 的 开发 与 其 他 复杂 产品 的 开发 和 制造 过 程 相似 。 他 仔细 研 
究 了 这 些 过 程 ， 以 便 把 它们 的 原理 和 过 程 应 用 到 信息 系统 企业 体系 结构 的 开发 过 程 之 中 。 建 立 
企业 的 体系 结构 可 以 使 组 织 更 有 效 地 完成 从 业务 策略 到 实现 的 步骤 。Zachman (1997，p.48) 
把 企业 体系 结构 定义 为 :“ 与 描述 某 个 企业 相关 的 描述 性 表示 ( 即 模型 ) 的 集合 ， 这 使 得 它 
( 指 企业 ) 能 够 符合 管理 者 的 要 求 (质量 )， 并 能 够 在 其 有 效 的 生命 周期 (变化 ) 中 进行 维护 ”。 

在 系统 开发 中 经 常会 看 到 ， 由 于 开发 者 关注 建立 企业 系统 的 片段 而 忽视 了 企业 视图 。 当 把 
这 些 片段 集成 到 一 个 正常 运行 的 企业 系统 时 ， 往 往 会 出 现 问题 。 有 些 系统 在 完成 时 就 不 能 正常 
工作 ， 或 者 后 来 不 能 正常 工作 。 系 统 维护 的 成 本 在 一 个 新 系统 总 体 成 本 中 占据 很 大 一 部 分 。 像 
千年 虫 ( 据 Garnter 估 计 ， 它 大 约 在 全 球 造成 了 400 亿 美元 的 损失 ) 这 样 的 问题 就 是 由 于 过 去 没 
有 很 好 地 处 理 企 业 体系 结构 内 的 数据 元 素 定 义 造成 的 。 

理想 情况 下 ， 任 何 数据 库 开发 项 目 都 应 当 在 其 企业 体系 结构 里 完成 。 这 就 意味 着 ， 首 先 开 
发 与 业务 要 求 相 一 致 的 概念 数据 模型 ， 然 后 将 它 转换 成 逻辑 数据 模型 、 物 理 数据 模型 以 及 被 实 
现 的 系统 。 这 种 一 致 性 得 到 极 大 的 重视 ， 并 成 为 任何 数据 库 设 计生 命 周 期 的 一 部 分 。 但 是 ， 概 
念 数据 模型 也 必须 要 与 Zachman 框 架 相 吻合 ， 后 者 是 由 业务 过 程 模型 、 业 务 网 络 逻 辑 、 企 业内 
的 工作 流 模型 、 企 业 总 日 程 计划 以 及 企业 业务 计划 等 组 成 的 。 其 中 的 每 一 个 部 分 (例如 概念 数 
据 模型 ) 都 有 其 固有 的 体系 结构 ， 但 它 也 必须 与 该 框架 的 其 他 部 分 的 体系 结构 相 协调 。 必 须 考 
虑 到 每 个 部 件 的 执行 给 整个 企业 所 带 来 的 影响 ， 并 要 解决 各 种 问题 和 不 连续 性 。 

凡是 建立 企业 体系 结构 并 开发 标准 及 过 程 以 确保 系统 开发 项 目 符合 该 企业 体系 结构 的 组 
织 ， 都 应 该 能 体会 到 这 样 做 的 好 处 。 代 码 可 以 重用 ， 系 统 是 有 机 地 组 合 在 一 起 而 不 是 彼此 冲突 
的 ， 业 务 目 标 也 是 匹配 的 。 当 业务 规则 的 匹配 和 协作 变 得 更 加 复杂 的 时 候 ， 这 些 建立 企业 体系 
结构 的 组 织 应 当 能 够 比 没 有 开发 企业 体系 结构 的 组 织 ， 更 快 和 更 一 致 地 实现 那些 业务 规则 。 在 
今天 竞争 激烈 的 环境 下 ， 这 可 以 使 组 织 获 得 相当 大 的 战略 上 的 收益 。 


12.5 数据 库 的 规划 
数据 库 开发 生命 周期 的 初始 阶段 是 规划 。 在 这 段 时 间 里 ， 应 当 从 企业 体系 结构 的 角度 仔细 
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券 虑 所 提议 的 系统 。 数 据 库 设 计 应 该 在 企业 信息 系统 的 约束 下 进行 。 在 规划 阶段 ， 对 所 提议 的 
数据 库 系统 作出 初步 的 评估 。 该 提议 系统 应 当 与 作为 企业 体系 结构 的 一 部 分 的 业务 目标 和 战略 
相 吻 合 。 企 业 体系 结构 中 Scope 层 的 其 他 部 分 也 是 很 重要 的 : 

* 会 包含 哪些 数据 ?预先 标识 它们 对 于 业务 是 否 很 重要 ? 

* 系统 将 完成 哪些 处 理 过 程 ? 是 否 需要 把 这 些 过 程 标识 为 重要 的 组 织 过 程 ? 

* 系统 会 影响 哪些 业务 位 置 ?所 标识 的 位 置 是 否 应 当 受 到 这 类 系统 的 影响 ， 或 者 是 否 标识 

出 某 些 无 意 间 受到 影响 的 位 置 ? 

* 该 系统 会 影响 哪些 部 门 与 个 人 ， 或 者 哪些 部 门 及 个 人 会 应 用 该 系统 ? 这 些 结 果 的 特点 是 

什么 ?哪些 影响 是 部 分 在 请 求 新 系统 时 没有 预料 到 的 ? 

“该 系统 是 如 何 处 理 重大 业务 事件 的 ? 新 系统 能 否 适应 现 有 的 时 间 安 排 ? 

“ 该 数据 库 会 保存 多 少数 据 ? 为 了 支持 应 用 软件 ， 对 硬件 的 大 小 与 容量 有 何 要 求 ? 候选 的 

DBMS 在 数据 库 安装 后 增长 时 ， 是 否 很 容易 进行 扩展 (例如 ， 在 不 对 数据 库 进行 规模 较 

大 的 重 设计 或 变更 硬件 的 情况 下 ，DBMS 能 否 支 持 更 多 的 用 户 、 更 多 的 应 用 软件 、 更 大 

型 文件 等 ) ? 

初始 评估 也 包括 考虑 继续 使 用 现 有 系统 、 修 改 现 有 系统 或 者 替换 现 有 系统 。 留 待 进一步 解 
决 的 决策 还 有 ， 现 有 系统 存在 哪些 缺陷 以 及 改正 这 些 缺 陷 的 可 能 性 。 

倘若 有 可 能 建立 新 系统 ， 那 就 应 该 进行 可 行 性 研究 。 可 行 性 研究 应 当 解 决 该 项 目 在 技术 方 
面 的 问题 ， 包 括 硬件 和 软件 的 选 购 或 开发 成 本 、 运 行 环境 、 系 统 的 大 小 与 复杂 性 以 及 与 相似 系 
统 的 体验 程度 。 此 肇 不必 考虑 特定 的 供应 商 或 者 产品 ， 但 应 该 对 实现 的 类 别 (如 PC 还 是 主机 、 
数据 库 模 型 和 编程 的 语言 ) 进行 考虑 。 可 行 性 研究 也 应 当 对 该 项 目的 成 本 进行 估算 ， 包 括 有 形 
的 与 无 形 的 。 成 本 应 当 区 分 出 与 项 目 相关 的 一 次 性 成 本 和 货 穿 系统 整个 生命 期 的 重复 成 本 。 还 
应 当 确 定 运 作 可 行 性 ， 即 评估 该 项 目 实现 其 期 望 目标 的 可 能 程度 。 还 应 当 评 估 在 预期 时 间 之 内 
完成 项 目的 可 能 程度 。 此 刻 ， 还 应 当 确定 出 所 有 可 能 的 法 律 与 合同 类 的 问题 。 应 当 考 虑 到 该 项 
目的 政治 性 后 果 。 注 意 ， 支 持 该 项 目的 主要 投资 人 会 极 大 地 美化 其 成 功 的 前 景 。 

一 旦 收集 好 可 行 性 信息 ， 就 可 以 举行 包含 所 有 相关 方 在 内 的 项 目的 正式 评审 。 这 次 评审 的 
主要 目标 是 ， 检 验 早 在 项 目 开始 之 前 就 准备 好 的 基线 计划 里 的 所 有 信息 和 假设 。 在 论证 项 目 之 
后 ,规划 阶段 所 确定 的 问题 将 在 项 目的 分 析 阶 段 里 再 作 进 一 步 的 研究 。 


12.6 数据 安全 性 的 管理 


数据 库 安 全 性 (database security ) 的 目的 是 保护 数据 ， 使 其 免 遭 可 能 会 破坏 其 完整 性 的 有 
意 或 无 意 的 威胁 及 访问 。 数 据 库 环境 已 经 变 得 相当 复杂 ， 具 有 位 于 客户 /服务 器 体系 结构 上 的 
分 布 式 数据 库 ， 而 非 主 机 。 通 过 因特网 和 内 部 网 ， 访 问 变 得 更 加 开放 。 其 结果 是 ， 有 效 地 管理 
数据 安全 性 已 变 得 更 加 困难 ， 更 加 耗费 时 间 。 我 们 在 第 9 章 已 经 介绍 过 一 些 针对 客户 /服务 器 和 
基于 Web 系 统 的 安全 性 过 程 。 数 据 管 理 负责 开发 保护 数据 的 总 体 策略 和 过 程 。 以 下 将 讨论 在 确 
立 充 分 的 数据 安全 性 时 数据 管理 员 应 当 采 用 的 一 些 工具 ， 不 过 重要 的 是 首先 了 解 一 下 数据 安全 
性 的 潜在 威胁 。 
12.6.1 数据 安全 性 的 威胁 

对 数据 安全 性 的 威胁 可 以 是 对 数据 库 的 直接 威胁 。 例 如 ， 一 些 未 授权 用 户 非法 访问 某 个 数 
据 库 ， 然 后 就 可 能 会 浏览 、 改 变 或 者 偷窃 他 们 已 经 非法 访问 的 数据 。 然 而 ， 只 注重 数据 亩 的 
安全 性 ， 并 不 能 确保 获得 安全 的 数据 库 。 必 须要 确保 系统 的 所 有 部 分 都 是 安全 的 ， 包 括 数据 
库 、 网 络 、 操 作 系 统 、 安 装 该 数据 库 的 建筑 物 以 及 任何 有 机 会 访问 该 系统 的 人 十 。 图 12-2 描 给 
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了 可 能 威胁 数据 安全 性 的 众多 位 置 。 要 实现 这 - 站 人 全) 需要 仔细 地 观察 ， 确 立 安 
全 性 过 程 与 策略 ， 以 及 实施 和 强制 这 些 过 程 与 策略 。 每 一 份 全 面 的 数据 安全 性 计划 都 必须 解 
决 下 面 提 到 的 问题 。 




















图 12-2 威胁 数据 安全 性 的 可 能 位 置 


“ 偶然 的 损失 ， 包 括 人 为 的 错误 、 软 件 与 硬件 所 引起 的 漏洞 建立 诸如 用 户 授权 、 统 一 的 软 
件 安装 过 程 和 硬件 维护 日 程 安排 等 操作 过 程 ， 这 些 都 是 可 以 用 来 避免 偶然 损失 威胁 的 操 
作 。 不 管 怎么 努力 ， 由 于 这 涉及 到 人 类 的 本 性 ， 有 些 损 失 是 不 可 避免 的 ,但 倘若 能 采取 
一 些 合理 的 策略 和 过 程 ， 应 该 是 可 以 减少 损失 的 总 量 与 严重 程度 。 有 可 能 造成 更 严重 后 
果 的 则 是 非 偶然 性 的 威胁 。 

* 偷窃 和 欺诈 这 些 活动 是 由 人 来 实施 的 犯罪 活动 ， 很 可 能 利用 电子 手段 ， 也 有 可 能 改动 或 
者 不 改动 数据 。 此 时 ， 应 当 关 注 图 12-2 中 的 每 一 个 可 能 位 置 上 。 例 如 ， 应 当 确立 起 物理 
安全 性 的 控制 ， 使 得 未 得 到 授权 的 人 没有 机 会 进入 机 房 。 在 运行 工资 单 这 样 的 机 密 文件 
之 前 ， 要 启用 限制 改变 数据 的 数据 访问 策略 ， 这 样 有 助 于 保护 数据 安全 。 建 立 防火 墙 ， 
以 防止 非 授 权 用 户 通过 外 部 通信 链接 访问 数据 库 中 不 允许 访问 的 部 分 是 安全 性 过 程 的 另 
一 个 例子 ， 这 会 阻止 企图 实施 偷窃 或 欺诈 的 人 士 。 

“ 私密 性 或 机 密 性 的 损失 ”私密 性 的 损失 通常 是 指 个 人 数据 的 损失 ， 而 机 密 性 损失 通常 则 
是 指 关 键 性 组 织 数据 (它们 对 于 组 织 往往 可 能 具有 战略 价值 ) 的 损失 。 私 密 性 信息 的 泄 
露 会 导致 黑色 邮件 、 行 贿 受 贿 、 公 众 丑闻 或 用 户口 令 的 丢失 。 机 密 性 信息 的 丢失 可 能 会 
导致 企业 丧失 竞争 力 。 现 在 ，( 美 国 ) 的 某 些 州 和 联邦 已 经 出 台 相 应 的 法 律 ， 要 求 某 类 组 
织 创建 与 交流 确保 顾客 和 客户 私密 性 数据 的 策略 。 安 全 性 机 制 必须 强制 执行 这 些 策略 ， 
否则 会 在 资金 和 声誉 方面 造成 巨大 的 损失 。 

* 数据 完整 性 的 损失 在 数据 完整 性 遭 到 破坏 时 ， 数 据 就 会 变 得 无 效 或 者 错误 百出 。 除 非 数 
据 完整 性 能 够 通过 建立 备份 与 恢复 过 程 加 以 复原 ， 否 则 ， 组 织 将 会 蒙受 严重 的 损失 ， 或 
者 根据 无 效 的 数据 作出 不 正确 与 费用 昂贵 的 决策 。 

“可 用 性 的 损失 ”对 于 用 户 来 说 ,硬件 、 网 络 或 应 用 软件 若 遭 到 破坏 ， 有 可 能 造成 数据 无 
法 使 用 ， 这 又 将 会 再 次 导致 严重 的 运作 困难 。 

一 份 全 面 的 数据 安全 性 计划 还 包括 建立 管理 性 策略 与 过 程 、 物 理 保护 以 及 数据 管理 软件 保 

护 。 数 据 管理 软件 的 最 重要 的 安全 性 特性 如 下 : 
1) 视图 或 子 模式 ， 它 们 将 限制 用 户 对 数据 库 的 查看 。 
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2) 域 、 断 言 、 检 查 以 及 定义 成 数据 库 对 象 的 其 他 完整 性 控制 ， 由 DBMS 在 数据 库 查 询 与 更 
新 时 执行 。 
3) 授权 规则 ， 标 识 用 户 并 限制 用 户 可 以 对 数据 库 采 取 的 操作 。 
4) 用 户 自 定义 过 程 ， 在 使 用 数据 库 时 定义 补充 的 约束 与 限制 。 
5) 加 密 过 程 ， 把 数据 编码 成 不 可 识别 的 形式 。 
6) 认证 方案 ， 明 确 地 标识 出 试图 访问 数据 库 的 人 。 
7) 备份 、 日 志 记录 和 检测 点 功能 ， 这 些 功能 有 助 于 完成 恢复 。 
12.6.2 视图 
在 第 7 章 里 ， 我 们 把 视图 定义 为 展示 给 一 -个 或 多 个 用 户 的 数据 库 的 子 集 。 创 建 视图 首先 要 
查询 一 个 或 多 个 基 表 ， 然 后 在 用 户 发 出 请 求 时 产生 一 个 动态 的 结果 表 。 因 此 ， 视 图 总 是 建立 在 
其 赖 以 构建 的 基 表 的 当前 数据 上 的 。 视 图 的 优势 在 于 ， 它 能 够 仅仅 显示 用 户 需 要 访问 的 数据 ， 
有 效 地 防止 了 用 户 查 看 其 他 一 些 可 能 具有 私密 性 或 机 密 的 数据 。 可 以 授予 用 户 访问 视图 的 权限 ， 
但 不 允许 该 用 户 访问 此 视图 所 赖 以 建立 的 基 表 。 从 而 ， 相 对 于 允许 访问 基 表 的 用 户 来 说 ， 某 些 
用 户 只 能 局 限于 视图 的 规定 ， 可 能 是 更 严格 的 限制 。 
例如 ， 我 们 可 以 为 松 谷 家 具 公 司 的 员工 构建 一 个 视图 ， 该 视图 提供 制造 一 个 松 谷 家 具 公 司 
产品 所 需要 材料 的 信息 ， 但 不 提供 其 他 (诸如 单价 之 类 ) 与 员工 工作 无 关 的 信息 。 创 建 列举 所 需 
要 的 木材 和 每 个 产品 可 使 用 的 木材 的 视图 的 命令 如 下 所 示 : 
CREATE VIEW MATERIALS V 
AS 
SELECT PRODUCT T.PRODUCT ID, PRODUCT NAME, FOOTAGE, 
FOOTAGE_ON_HAND 
FROM PRODUCT T, RAW MATERIALS T, USES T 
WHERE PRODUCT T.PRODUCT ID=USES T.PRODUCT ID 


AND RAW_MATERIALS T.MATERIAL ID= 
USES_T.MATERIAL ID; 


所 创建 视图 的 内 容 在 每 次 访问 该 视图 时 ， 都 将 进行 更 新 ， 下 面 是 该 视图 的 当前 内 容 (可 以 使 用 
SQL 命令 来 访问 )。 


SELECT*FROM MATERIALS V; 


PRODUCT ID PRODUCT NAME FOOTAGE FOOTAGE ON_HAND 
1 End Table 4 1 
2 Coffee Table 6 11 
3 Computer Desk 15 11 
4 Entertainment Center 20 84 
5 Writer'S Desk 13 68 
6 8-Drawer Desk 16 66 
7 Dining Table 16 11 
8 Computer Desk 15 9 


8 rows selected. 


用 户 可 以 针对 视图 编写 SELECT 语句 ， 即 可 以 将 视图 视 为 一 张 表 。 尽 管 视图 通过 限制 用 户 
对 数据 的 访问 ， 提 高 了 安全 性 ， 但 它们 并 不 是 最 充分 的 安全 措施 ， 因 为 未 授权 人 士 可 能 会 了 解 
或 者 访问 特定 的 视图 。 其 次 ， 几 个 人 可 以 共享 某 个 特定 的 视图 ， 其 中 每 个 人 都 有 权 读 取 数据 ， 
但 只 有 其 中 的 几 个 人 有 权 更 新 其 数据 。 最 后 ， 利 用 高 级 查询 语言 ， 未 授权 人 士 通过 简单 的 试验 
就 可 能 访问 数据 。 因 此 ， 我 们 还 需要 更 为 复杂 的 安全 措施 。 
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12.6.3 完整 性 控制 


完整 性 控制 保护 数据 免 遭 未 经 授权 的 使 用 与 更 新 。 通 常 ， 完 整 性 控制 限制 某 个 字段 所 能 保 


存 的 值 ， 限 制 在 数据 上 所 能 完成 的 操作 ， 或 者 触发 执行 某 个 过 程 ， 如 在 某 个 日 志 上 设置 一 项 ， 
以 便 记 载 哪个 用 户 对 哪些 数据 做 了 哪些 操作 。 ， 

完整 性 控制 的 形式 之 一 便 是 域 。 实 际 上 ， 域 是 创建 用 户 自 定义 数据 类 型 的 一 种 途径 。 一 旦 
定义 了 某 个 域 ， 某 个 字段 就 能 够 将 该 域 作 为 其 数据 类 型 。 例 如 ， 下 列 用 SQL 定义 的 PriceChange 
域 就 可 以 作为 任何 数据 库 字 段 (如 PriceIncrease 和 PriceDiscount) 的 数据 类 型 ， 以 限制 在 其 个 
事务 中 可 能 增加 的 总 量 标准 价格 : 

CREATE DOMAIN PriceChange AS DECIMRAL 

CHECK(VALUE BETWEEN .001 and .15); 


然后 ， 比 如 说 ， 在 某 个 制定 价格 的 事务 表 定 义 里 ， 我 们 就 可 以 定义 : 

PriceIncrease PriceChange NOT NULL, 
域 的 好 处 之 一 是 ， 倘 车 它 改 变 ， 那 么 可 以 只 在 一 个 地 方 ， 即 域 定义 的 位 置 作出 改变 ， 处 于 该 域 
的 所 有 字段 便 会 自动 地 改变 。 换 一 种 做 法 ， 也 可 以 在 Priceincrease 字 段 和 PriceDiscount 字 段 上 
的 约束 中 包括 相同 的 CHECK 子 句 。 但 是 ， 此 时 如 果 CHECK 的 限制 需要 改变 ， 那 么 DBA 就 必须 
找 出 这 个 完整 性 控制 的 每 一 个 实例 ， 并 分 别 在 每 一 处 进行 修改 。 

断言 是 强制 实施 -一定 的 数据 库 条 件 的 强 有 力 的 约束 手段 。 断 言 是 由 DBMS 在 运行 存在 此 断 
守 的 表 或 字段 时 自动 地 进行 检查 的 。 例 如 ， 假 设 某 个 员工 表 包 含 字 段 EmpID 、EmpName、 
SupervisorID 和 SpouseID。 假 如 公司 的 一 条 制度 是 ， 任 何 员工 都 不 可 以 管理 自己 的 配偶 。 下 列 
断言 会 强制 实施 这 一 规则 : 

CREATE ASSERTION SpousalSupervision 

CHECK (SupervisorID<>SpouselrD); 


如 果 该 断言 不 满足 ，DBMS 将 会 产生 一 个 错误 消息 。 
言 可 能 会 变 得 相当 复杂 。 假 设 松 谷 家 具 公 司 有 一 条 制度 是 ， 两 个 推销 员 不 得 同时 被 分 配 
相 回 的 销售 区 域 。 假 如 Salesperson 表 包含 字段 SalespersonID 和 TerritoryID。 这 一 断言 可 以 采用 
一 个 相关 的 子 查 询 写 为 : 
CREATE ASSERTION TerritoryAssignment 
CHECK (NOT EXISTS 
{SELECT*FROM Salesperson SP WHERE SP.TerritoryID IN 


(SELECT SPP.TerritoryID FROM Salesperson SSP WHERE 
SSP.SalespersonID<>SP.SalespersonID)));} 


最 后 ， 触 发 器 也 可 以 用 于 保证 安全 性 。 在 第 8 章 里 定义 并 说 明 过 触发 器 。 触 发 器 中 可 以 包 
含 事件 、 条 件 和 动作 、 它 要 比 一 个 断言 更 为 复杂 。 例 如 ， 一 个 触发 器 可 以 完成 以 下 任务 : 

* 禁止 不 适宜 的 动作 (例如 ， 在 正常 工作 日 之 外 改变 某 个 工资 值 )。 

* 引起 特殊 的 处 理 过 程 的 执行 (例如 ， 倘 车 在 规定 日 期 之 后 才 收 到 顾客 的 支付 要 据 ， 那 么 

可 以 对 该 顾客 的 账户 追加 罚金 )。 

"导致 在 某 个 日 志文 件 上 写 人 人 一行， 以 反映 有 关 用 户 和 涉及 敏感 数据 的 事务 的 重要 信息 ， 

这 样 ， 该 日 志 可 以 通过 人 工 或 者 自动 化 的 过 程 来 审阅 ， 来 确定 是 否 可 能 存在 不 适宜 行为 

(例如 ， 日 志 可 以 记载 某 个 用 户 对 某 个 员工 进行 了 工资 修改 )。 

和 采用 域 一 样 ， 触 发 器 的 优势 在 于 ， 可 以 像 任何 存储 过 程 那样 ， 使 得 DBMS 强 制 实施 对 所 
有 用 户 和 所 有 数据 库 活动 实行 这 种 控制 。 该 控制 不 必 编 码 到 每 一 个 查询 或 程序 中 。 因 此 ， 对 于 
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个 人 用 户 和 程序 ， 就 无 须 施加 必要 的 控制 。 
12.6.4 授权 规则 

授权 规则 (authorization rule) 就 是 指 包含 在 数据 库 管 理 系 统 中 ， 限 制 对 数据 的 访 回 ， 并 
限制 入 们 在 访问 数据 时 所 能 采取 的 操作 的 各 种 控制 。 例 如 ， 提 供 某 个 特定 口令 的 人 可 能 被 授权 
谈 取 数 据 库 里 的 任何 记录 ， 但 他 不 一 定 可 以 对 那些 记录 作 任 何 修 改 。 

Fernandez、Summers 和 Wood(1981) 曾 经 开发 过 一 个 数据 库 安 全 性 的 概念 模型 。 该 模型 以 包含 
上 主体、 对象、 动作 和 约束 的 一 个 表 (或 什 阵 ) 形式 来 表示 授权 规则 。 该 表 的 每 - - 行 表示 被 授权 
主体 可 以 (或许 受到 某 些 约束 ) 对 该 数据 库 的 某 个 对 象 实施 某 种 动作 。 图 12-3 显 示 了 这 种 授权 秆 
阵 的 一 个 例子 。 这 张 表 包 含 几 个 项 ， 这 些 项 涉及 会 计数 据 库 中 的 记录 。 例 如 ， 表 的 第 ! 行 表示 ， 
销售 部 的 任何 人 都 有 权 在 数据 库 里 插入 一 个 新 的 顾客 记录 (只 要 该 顾客 的 信用 限额 不 超过 $5000 
即 可 。 基 后 一 行 表 示 ， 程 序 AR4 有 权 修 改 订 单 记录 而 无 任何 约束 。 数 据 管理 负责 确定 和 实现 在 数 
据 库 级 别 上 实现 的 授权 规则 。 授 权 方 案 也 可 以 在 操作 系统 级 别 或 者 应 用 软件 级 别 上 实现 。 














i 体 对 家 操作 约 束 
销售 部 顾 各 记 导 插入 信用 限制 低 $5 000 
订单 传送 顾客 记录 读 取 无 
终端 12 般 客 记 并 修改 仅 限 了 账户 余额 
会 计 部 订单 记 起 删除 无 
Ann Walker 订单 记录 插入 订单 总 额 大 于 $2 000 
程序 AR4 这 单 记录 修改 无 





图 12-3 授权 矩阵 


大 多 数 现代 数据 库 管 理 系 统 并 不 像 图 12-3 那 样 实现 授权 矩阵， 它们 通常 采用 简化 的 版 本 。 
主要 存在 两 种 类 型 : 用 于 主体 的 授权 表 和 对 于 对 象 的 授权 表 。 图 12-4 给 出 了 每 种 类 型 的 一 个 例 
子 。 例 如 ， 在 图 12-4a 里 我 们 看 到 ， 推 销 员 可 以 修改 顾客 记录 ， 但 不 能 删除 这 些 记录 。 在 图 12- 
4b 里 ， 订 单 孙 入 或 者 会 计 用 户 可 以 修改 订单 记录 ， 但 推销 人 员 则 不 可 以 修改 订单 记录 。 某 个 
DBMS 产 品 可 能 提供 其 中 任 一 种 工具 ， 也 可 能 两 种 工具 同时 兼 有 。 

图 12-4 所 示 的 授权 表 是 一 个 组 织 的 数据 及 其 环境 的 属性 ， 因 此 ， 应 当 将 它们 看 成 是 元 数据 。 
该 表 应 该 在 信息 库 中 存储 并 维护 。 由 于 授权 表 包 含 高 度 敏感 的 数据 ， 所 以 它们 本 身 也 应 当 用 严 
格 的 安全 性 规则 进行 保护 。 通 常 ， 在 数据 管理 中 只 有 经 过 严格 选拔 出 的 人 才 有 权 访问 和 修改 这 
些 表 。 


销售 人 员 订单 法 入 会 计 


晤 客 记录 订单 记 菜 (口令 BATMAN) (中信 JOKER) (I1 令 TRACY) 





a) 对 于 主体 (推销 黄 ) 的 授权 规则 b) 对 于 对 象 (i 了 单 记录 ) 的 授权 规则 
图 12-4 授权 规则 的 实现 


例如 ， 在 Oracle 8i 中 ， 可 以 在 数据 库 或 表 级 授予 用 户 图 12-5 所 包括 的 特权 。INSERT 与 
UPDATE 权 限 可 以 在 列 级 授予 。 如 果 许 多 用 户 (例如 从 事 同 一 种 工作 的 用 户 ) 需要 相同 的 权限 ， 
就 可 以 创建 一 个 包含 这 些 权限 的 角色 ， 然 后 就 可 以 通过 对 该 角色 授权 而 达到 对 用 户 赋予 相应 的 
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权限 。 为 了 向 登录 ID 为 smith 的 用 户 授 了 予 读 取 产品 表 和 更 新 价格 的 权限 ， 可 以 采用 下 列 SQL 命 令 : 
GRANT SELECT, UPDATE (unit price)oON PRODUCT T TO SMITH; 
有 八 个 数据 词典 视 禾 包 含 着 有 关 可 以 赋予 的 权限 的 信息 。 在 本 例 中 ，DBA_TAB_PRIVS 包 
含 用 户 以 及 用 户 的 对 象 (用 户 有 操作 该 对 象 的 权限 ， 如 表 )。DBA_COL_PRIVS 则 包含 在 表 的 
列 上 赋 有 权限 的 用 户 。 


权 限 
SELECT 查询 对 象 
INSERT 将 记录 插入 表 或 视图 中 。 可 以 针对 特定 列 进行 操作 
UPDATE 更 新 表 或 视图 中 的 记录 。 可 以 针对 特定 列 进行 操作 


DELETE 从 表 或 视图 中 删除 记录 
ALTER 改动 表 

INDEX 创建 表 的 索引 
REFERENCES 创建 参照 该 表 的 外 键 
EXECUTE 执行 过 程 、 软 件 包 或 函数 





图 12-5 Oracle 8i 的 权限 


12.6.5 用 户 自 定义 过 程 

除了 前 面 讨 论 的 授权 规则 以 外 ， 某 些 DBMS 产 品 还 提供 用 户 出 口 (或 界面 )， 允 许 系 统 设 
计 人 员 或 者 用 户 创建 他 们 自己 的 用 户 自 定义 过 程 (user-defined procedure) 以 保证 安全 性 。 例 
如 ， 可 以 设计 一 个 用 户 过 程 来 提供 明确 的 用 户 ID。 在 试图 登录 计算 机 时 ， 用 户 除 了 提供 口令 以 
外 ， 可 能 还 要 提供 过 程 的 名 称 。 如 果 口 令 有 效 ， 并 且 提 供 了 过 程 名 称 ， 则 系统 将 会 调用 该 过 程 ， 
询问 用 户 一 系列 其 答案 应 该 只 有 该 口令 的 持 有 者 才 知 道 的 问题 (比如 母亲 娘家 的 姓 )。 
12.6.6 ”加 密 

对 于 公司 财务 数据 这 种 高 度 敏感 性 数据 ， 不 妨 可 以 采用 加 密 。 加 密 (encryption ) 就 是 对 
数据 进行 编码 ， 这 样 人 们 不 能 读 出 它们 。 有 些 DBMS 产 品 本 身 带 有 加 密 例 程 ， 在 敏感 数据 存储 
或 者 在 通信 信道 上 进行 传输 时 ， 系 统 自动 地 对 其 进行 编码 。 例 如 ， 在 电子 资金 转账 (EFT) 系 
统 里 普遍 采用 加 密 。 其 他 一 些 DBMS 产 品 则 提供 允许 用 户 编写 自己 的 加 密 例 程 的 界面 。 

提供 加 密 工 具 的 系统 ， 必 须 同时 提供 配套 的 数据 解码 例 程 。 这 些 解码 例 程 必须 由 相应 安全 
性 措施 进行 严格 保护 ， 否 则 加 密 的 优势 就 表 失 了 ， 因 此 ， 它 们 也 需要 相当 多 的 计算 资源 。 

现在 有 两 种 常用 的 加 密 形 式 : 单 密 钥 方法 和 双 密 钥 方 法 。 采 用 单 密 钥 (one-key ) 方法 
(又 称 为 数据 加 密 标 准 (DES))， 发 送 方 和 接收 方 两 者 都 需要 知道 用 来 对 传输 或 存储 的 数据 进行 
编码 的 密 钥 。 双 密 钥 (two-key) 方法 (又 称 为 对 偶 密 钥 方法 、 公 众 密 钥 方法 或 者 非 对 称 加 密 )， 
使 用 一 把 私 钥 和 一 把 公 钥 。 双 密 钥 方法 为 信用 卡号 码 之 类 的 支付 数据 提供 了 安全 性 传输 与 数据 
库存 储 ， 所 以 在 电子 商务 应 用 软件 中 特别 受 欢迎 。 采 用 这 种 方法 ， 所 有 的 用 户 都 知道 彼此 的 公 
钠 , 但 只 有 每 个 人 才 知 道 其 私 钥 。 首 先 ， 用 户 从 受托 系统 (例如 DBMS 或 与 DBMS 一 起 工作 的 
安全 性 系统 ) 分 配 到 一 对 密 钥 。 一 条 消息 (比如 更 新 数据 库 的 一 个 事务 ) ， 先 分 别 用 发 送 方 的 
私 钥 和 接收 方 的 公 钥 进行 加 密 ; 这 条 消息 只 能 用 接收 方 的 私 钥 和 发 送 方 的 公 钥 来 解密 。 这 里 的 
发 送 方 和 接收 方 ， 可 以 是 两 个 用 户 (或 用 户 程序 )， 也 可 以 是 DBMS 和 一 个 用 户 ( 或 用 户 程 序 )。 
双 密 钠 方 法 取决 于 其 公 钥 目录 是 安全 的 ， 不 可 能 被 破坏 。 因 而 ， 该 公 钥 必须 在 如 第 三 方 这 样 的 
高 度 安全 的 环境 里 进行 维护 。 目 前 已 经 有 像 Verisign 这 样 的 专门 从 事 维护 公 钥 和 检验 新 密 钥 的 
公司 。 数 字符 名 是 双 密 钥 方法 的 一 种 变形 ， 它 为 电子 商务 提供 证 据 、 形 式 化 、 确 认 、 有 效 性 和 
认证 (关于 数字 签名 和 公 钥 验证 的 详细 说 明 ， 请 参见 Web 资 源 http://abanet.org/scitech/ec/isc/ 
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dsg-tutorial.html ) 。 
12.6.7 认证 模式 

计算 机 界 一 个 长 期 令 人 困扰 的 问题 是 ， 如 何 正确 地 标识 出 试图 访问 计算 机 或 其 资源 的 人 
[:? 第 一 道 防线 是 利用 口令 ， 口 令 能 提供 一 定 程度 的 保护 。 然 而 ， 人 们 把 口令 分 配给 各 种 设备 
后 ， 很 快 又 要 设计 记 住 这 些 口 令 的 方法 ， 这 些 方法 会 降低 口令 方式 的 有 效 性 。 口 令 被 写 下 来 ， 
其 他 人 可 能 会 发 现 它们 。 其 他 用 户 共享 这 些 口令 ， 整 个 部 门 共同 使 用 一 个 访问 口令 的 情况 并 不 
少见 。 让 口令 包括 在 自动 登录 脚本 里 ， 这 虽然 省 去 了 记忆 与 键入 口令 的 麻烦 ， 但 同时 也 消除 了 
口令 的 有 效 性 。 其 次 ， 口 令 通 常 是 以 明文 而 非 加 密 的 形式 遍历 网 络 的 ， 一 旦 被 窃听 ， 是 很 容易 
被 解释 出 来 的 。 此 外 ， 口 令 本 身 并 不 能 确保 计算 机 及 其 数据 库 的 安全 性 ， 因 为 它们 无 法 指出 是 
谁 在 试图 进行 访问 。 当 前 的 分 布 式 与 网 络 式 环境 需 要 更 进一步 的 安全 性 措施 。 有 各 种 方法 及 方 
法 的 组 合 正在 设法 解决 这 一 问题 。 

首先 ， 业 界 开发 出 了 一 些 设备 和 技术 ， 以 明确 地 标识 出 任何 可 能 的 用 户 。 其 中 前 景 最 被 看 
好 的 似乎 是 生物 设备 (biometric device)， 它 是 一 种 度量 或 者 检测 个 人 特征 的 技术 ， 这 些 特征 
包括 指纹 、 声 波纹 、 眼 球 图 或 者 动态 签名 等 。 由 于 用 来 获取 视网膜 影像 的 激光 有 可 能 会 伤害 到 
眼睛 ， 所 以 利用 视网膜 影像 的 方法 已 经 逐渐 淡出 。 为 了 实现 生物 方法 ， 有 好 几 家 公司 已 经 开发 
出 了 一 种 其 上 永久 性 地 财 有 个 人 惟一 生物 数据 (指纹 之 类 ) 的 智能 卡 。 为 了 访问 计算 机 ， 用 户 
将 该 卡 插 入 读 取 设 备 〈 一 种 生物 设备 ) 来 读 取 此 人 的 指纹 或 者 其 他 特征 。 然 后 将 实际 的 生物 数 
据 同 数据 库 里 的 数据 进行 比较 ， 对 于 访问 计算 机 的 用 户 来 说 ， 两 者 必须 匹配 。 丢 失 或 者 偷 来 的 
卡 ， 对 于 别人 是 没有 用 处 的 ， 因 为 生物 数据 不 会 相 匹配 。 这 类 智能 卡 对 于 ATM、 信 用 卡 消费 其 
至 于 电子 业务 来 说 都 是 非常 有 用 的 。 

妃 一 种 方法 是 利用 第 三 方 作 中 介 的 认证 系统 ， 它 通过 Kerberos 之 类 受信 任 的 认证 代理 来 确 
定 用 户 的 可 靠 性 。Kerberos 由 MIT 开 发 ， 主 要 在 应 用 软件 级 协议 ， 如 TELNET 或 FTP 中 使 用 ， 以 
提供 用 户 到 主机 的 安全 性 。 向 用 户 提供 一 种 密 钥 (Kerberos 卡 ) 的 Kerberos 套 件 ， 然 后 就 可 能 
被 伐 和 到 任何 其 他 的 网 络 协议 里 。 于 是 ,实现 了 这 种 协议 的 任何 过 程 ,都 可 以 确定 该 请 求 来 源 。 
Sun 公 司 也 有 一 种 认证 机 制 ， 称 为 DES 认 证 ， 该 认证 机 制 基于 发 送 消息 时 由 发 送 方 加 密 盖 上 一 
个 时 间 戳 ， 然 后 根据 接收 方 的 内 部 时 钟 进行 核对 。 这 就 要 求 与 代理 保持 当前 时 刻 的 一 致 性 ， 而 
且 两 者 都 必须 采用 相同 的 加 密 密 钥 。 不 利 因素 是 要 使 用 第 三 方 认证 方式 需要 获得 广泛 的 认同 。 
也 有 人 采用 一 种 建立 在 公 钥 认证 基础 上 的 认证 方式 ， 适 合 于 团体 性 标识 认证 ， 它 们 则 可 以 在 不 
进一步 涉及 第 三 方 的 情况 下 进行 交换 。 这 类 数字 认证 在 涉及 信用 卡 或 数字 现金 消费 的 电子 业务 
事务 中 得 到 广泛 应 用 。 

最 后 -个 认证 问题 是 建立 不 可 否认 性 。 也 就 是 说 ， 在 发 送 了 一 个 消息 之 后 ， 用 户 不 能 否认 
曾经 发 过 该 消息 ， 或 者 说 是 根本 没有 发 送 过 任何 消息 。 生 物 设备 与 消息 发 送 配合 使 用 就 可 以 确 
立 不 可 否认 性 。 


12.7 数据 库 的 备份 


数据 库 恢复 (database recovery) 是 数据 管理 对 于 Murphy 定 律 的 反应 。 数 据 库 不 可 避免 地 会 
由 于 某 种 可 能 是 由 人 为 错误 、 硬 件 故障 、 不 正确 或 无 效 的 数据 、 程 序 错误 、 计 算 机 病毒 、 网 络 
故障 、 冲 突 事务 或 者 自然 灾难 所 引起 的 系统 问题 而 遭受 破坏 或 者 丢失。 由 于 组 织 非 常 依赖 于 其 
数据 库 ， 所 以 数据 库 管理 系统 在 发 生 损失 或 破坏 后 ， 必 须 提供 迅速 而 精确 地 复原 数据 库 的 机 制 。 
12.7.1 基本 的 恢复 工具 

一 个 数据 库 管理 系统 应 当 提 供 四 种 基本 的 数据 库 备份 与 恢复 的 工具 : 
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DD 备份 工具 (backup facility) 周期 性 地 提供 数据 库 整 体 或 者 部 分 备份 的 拷贝 的 工具 。 

2) 旦 志 记 录 工 具 (journalizing facility) 维持 事务 和 数据 库 变更 的 一 份 审 计 追 踪 的 工具 。 

3) 检查 点 工具 DBMS 定 期 地 用 该 工具 挂 起 所 有 的 处 理 ， 与 控制 文件 同步 化 ， 并 作 日 志 记 录 。 

4) 恢复 管理 器 允许 DBMS 把 数据 库 复原 至 正确 的 条 件 ， 并 再 启动 处 理事 务 。 

1 . 备份 工具 

DBMS 应 当 提 供 备份 工具 ， 用 以 产生 整个 数据 库 以 及 控制 文件 和 日 志 的 一 个 备份 拷贝 (或 保 
存 本 )。 通 常 ， 备 份 措 贝 至 少 每 天 生成 一 次 。 该 拷贝 应 当 存 放 在 一 个 安全 的 场所 ， 以 防止 遭 到 
丢失 或 破坏 。 该 备份 拷贝 用 于 在 发 生硬 件 故 障 、 灾 难 性 损失 或 破坏 事件 发 生 时 复原 数据 库 。 有 
些 DBMS 配 备 有 备份 实用 程序 ， 供 DBA 进 行 备份 ; 另外 一 些 系统 是 假设 DBA 会 利用 操作 系统 的 
命令 、 导 出 命令 或 SELECT-INTO SQL 命 令 来 完成 备份 操作 。 由 于 在 每 天 夜里 都 需要 重复 性 地 
备份 某 个 数据 库 ， 所 以 预先 创建 一 个 可 以 自动 地 进行 有 规律 的 备份 的 脚本 将 会 节省 时 间 ， 而 且 . 
很 少 产生 备份 错误 。 

对 于 大 型 数据 库 来 说 ， 进 行 有 规律 的 备份 是 不 切实 际 的 ， 因 为 完成 该 备份 所 需 的 时 间 可 能 
相当 长 。 或 者 ， 某 个 数据 库 可 能 是 一 个 关键 性 的 系统 ， 它 必须 始终 保持 可 以 使 用 的 状态 ， 故 而 
采用 需要 关闭 数据 库 的 冷 备份 是 不 切实 际 的 。 此 时 有 规律 地 备份 动态 数据 ( 即 所 谓 热 备份 ， 其 
中 仅 有 一 部 分 数据 库 被 关闭 使 用 ) ， 而 不 备份 通常 是 不 变 的 静态 数据 ， 往 往 能 减少 占用 的 时 间 。 
可 以 以 一 定 的 时 间 间 栅 进 行 增 量 型 备份 (仅仅 记录 自 上 一 次 完整 备份 以 来 的 变化 ， 但 完成 一 次 
完整 省 份 需要 很 长 时 间 ) ， 这 样 ， 两 次 完整 备份 之 间 的 时 间 间 隔 就 会 延长 。 因 此 ， 确 定 备份 的 
策略 时 必须 以 对 于 数据 库 系 统 的 要 求 为 依据 。 

2. 日 志 记录 工具 

DBMS 必 须 配 备 日 志 记 录 工 具 ， 以 产生 一 份 事务 (transaction) 和 数据 库 变更 的 审计 追踪 。 
一 旦 出 现 故障 ,就 可 以 利用 该 日 志 中 的 记录 以 及 最 近 的 完整 备份 , 重新 建立 一 致 的 数据 库 状态 。 
如 图 12-6 所 示 ， 有 两 种 基本 的 日 志 或 日 记 。 第 一 种 就 是 事务 日 志 (transaction log )， 它 包含 着 
针对 该 数据 库 所 处 理 的 每 一 项 事务 的 基本 数据 的 记录 。 为 每 一 项 事务 所 记录 的 数据 包括 事务 代 
码 或 ID、 事 务 操作 或 类 型 (如 inserD、 事 务 的 时 间 、 终 端 编 号 或 用 户 ID 、 输 入 数据 值 、 所 访问 的 
表 或 记录 、 所 修改 记录 以 及 新 上 月 字段 值 。 

第 二 类 日 志 是 数据 库 变 更 日 志 (database change log )， 它 包含 被 事务 修改 的 记录 的 前 象 和 
后 象 。 前 象 (before image) 指 记录 在 被 修改 前 的 一 个 拷贝 ， 而 后 象 (after image) 则 指 被 修改 
后 的 同一 记录 的 一 个 拷贝 。 

有 些 系统 还 包含 一 个 安全 性 日 志 ， 一 旦 出 现 或 试图 违反 任何 安全 性 规则 时 ， 它 可 以 警告 
DBA。 

恢复 管理 器 利用 这 些 日 志 来 实施 undo (撤销 ) 和 redo ( 重 做 ) 操作 ， 这 些 内 容 将 在 本 音 后 
面部 分 再 作 阐 述 。 这 些 日 志 可 能 保存 在 磁盘 或 磁带 上 ; 因为 它们 对 于 恢复 是 很 重要 的 ， 所 以 也 
必须 对 其 加 以 备份 。 

3. 检查 点 工具 

检查 点 工具 (checkpoint facility) 在 DBMS 里 定期 地 拒绝 接收 任何 新 的 事务 。 首 先 完成 所 
有 进行 中 的 事务 ， 然 后 更 新 日 志文 件 。 此 刻 ， 系 统 处 在 一 种 安静 的 状态 ， 而 数据 库 和 事务 日 志 
是 同步 的 。DBMS 将 一 条 特殊 的 记录 ( 称 为 检查 点 记录 ) 写 入 该 日 志文 件 ， 这 就 像 是 数据 库 状 
态 的 一 个 快照 。 该 检查 点 记录 包含 重新 启动 系统 所 必需 的 信息 。 任 何 脏 数 据 块 ( 指 包含 还 没有 
号 人 磁盘 修改 的 内 存 页 面 ) 从 内 存 写 和 磁盘 存储 器 ， 从 而 确保 在 该 检查 点 之 前 作出 的 一 切 改变 
都 已 被 写 人 长 期 存储 器 。 
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DBMS 可 以 自动 地 (最 好 是 这 样 ) 或 者 以 响应 用 户 应 用 软件 命令 的 形式 来 设置 检查 点 。 检 
查 点 应 当 经 常设 置 (比如 说 ， 每 小 时 好 几 次 )。 一 旦 出 现 故 障 ， 通 常 可 以 从 最 近 一 次 检查 点 复 
原 ， 开 始 重新 处 理 。 因 此 ， 只 有 几 分 钟 的 处 理工 作 需 要 重新 完成 ， 而 不 必 完 全 重 做 当天 好 几 小 
时 的 处 理工 作 。 


御 务 恢复 操作 









下 务 或 恢复 操 
作 的 影响 


受 事 务 影 啊 的 


串 务 的 数据 库 拷 由 
拷贝 





数据 库 
(当前 ) 









图 12-6 数据 库 审计 追踪 

4. 恢 复 管理 器 

恢复 管理 器 (recovery manager) 是 DBMS 的 一 个 模块 ， 它 在 出 现 故 障 时 ， 将 数据 库 复原 成 
正确 的 条 件 ， 并 重新 开始 处 理 用 户 请 求 。 所 采用 的 重新 启动 类 型 取决 于 故障 的 本 质 。 恢 复 管理 
器 是 利用 图 12-6 所 示 的 日 志 (倘若 必要 时 ， 再 加 上 备份 拷贝 ) 来 复原 数据 库 的 。 
12.7.2 恢复 与 重启 动 过 程 

任 给 定 情况 下 ， 所 采用 的 恢复 过 程 的 类 型 取决 于 故障 的 本 质 、DBMS 恢 复工 具 的 精细 程度 
以 及 运作 策略 与 过 程 。 下 面 讨论 最 常用 的 一 些 技术 。 

]. 切换 

为 了 能 够 切换 某 数 据 库 的 某 个 现 有 拷贝 ， 该 数据 库 必须 是 镜像 的 。 也 就 是 说 ， 数 据 库 至 少 
必须 有 两 个 拷贝 ， 并 且 同 时 更 新 。 一 旦 出 现 故障 ， 处 理 就 切换 到 该 数据 库 的 另 一 个 拷贝 。 这 种 
策略 可 以 实现 最 快 的 恢复 ， 并 由 于 长 期 存储 器 价格 不 断 下 调 而 大 受 欢迎 。1 级 RAID 系 统 可 用 来 
实现 镜像 。 数 据 库 是 分 布 在 几 个 较 小 的 、 廉 价 的 磁盘 上 ， 并 镜像 到 -- 组 相同 的 磁盘 上 而 不 是 存 
储 在 一 个 大 的 驱动 器 上 。 当 一 个 磁盘 出 现 故障 时 ， 系 统 便 直 接 切 换 到 该 镜像 磁盘 上 。 有 问题 或 
受 损 的 磁盘 就 可 以 移 除 ， 并 用 一 个 新 的 磁盘 代替 它 。 该 磁盘 可 以 利用 镜像 磁盘 进行 重建 ， 而 且 
不 会 中 断 对 用 户 的 服务 。 此 类 磁盘 称 为 是 热 交 换 的 。 然 而 ， 这 种 策略 并 不 能 防止 掉 电 或 者 数据 
库 的 灾难 性 损害 。 

2. 复原 / 重 运 行 

复原 / 重 运行 (restore/rerun) 技术 涉及 在 要 恢复 的 数据 库 或 部 分 数据 库 的 备份 拷贝 上 重新 
处 理 当天 (直到 故障 点 为 止 ) 的 事务 。 首 先 关闭 数据 库 ， 接 着 安装 要 恢复 的 数据 库 或 文件 的 最 
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近 【〈 比 如 说 ， 前 一 天 的 ) 拷贝 ， 然 后 重新 运行 自 该 拷贝 以 来 出 现 的 所 有 事务 (它们 存放 在 事务 
日 志 里 )。 这 可 能 也 是 制作 事务 日 志 的 备份 拷贝 和 清除 或 重 做 事务 日 志 的 最 好 时 机 。 

复原 / 重 运行 的 好 处 是 其 简洁 性 。DBMS 不 需要 创建 数据 库 变 更 日 志 ， 也 不 需要 任何 特殊 
的 重新 启动 的 过 程 。 然 而 ， 它 有 两 点 不 利 因 素 。 首 先 ， 重 新 处 理事 务 的 时 间 可 能 令 人 无 法 接 
受 。 根 据 制 作 备 份 拷贝 的 频率 ， 重 新 处 理 可 能 需要 好 几 个 小 时 。 处 理 新 的 事务 应 当 推迟 到 恢 
复 完成 后 进行 ， 倘 车 系统 负载 很 重 ， 也 许 就 不 能 采用 它 。 其 次 ， 事务 的 顺序 与 其 最 初 的 处 理 
顺序 经 常 是 不 一 样 的 ， 这 可 能 会 产生 完全 不 同 的 结果 。 例 如 ， 按 原来 的 运行 顺序 ， 在 取款 之 
前 先 显 示 顾 客 的 存款 。 而 在 重 运行 时 ， 也 许 先进 行 取款 操作 ， 可 能 会 导致 向 顾客 发 送 资金 不 
足 的 通知 。 因 此 ， 复 原 / 重 运行 不 是 一 个 充分 的 恢复 过 程 ， 一般， 它 仅仅 是 作为 数据 库 处 理 不 
得 已 而 采用 的 手段 。 

3. 事务 完整 性 

数据 库 往往 通过 处 理 其 结果 是 变更 一 个 或 多 个 数据 库 记 录 的 事务 而 进行 更 新 。 如 果 在 处 理 
事务 时 出 现 错误 ,数据 库 可 能 会 遭 到 损害 ， 因 而 需要 某 种 形式 的 数据 库 恢 复 。 因 此 ， 为 了 理解 
发 计 库 恢复， 我 们 首先 必须 先 理解 事务 完整 性 概念 。 

个 业务 事务 就 是 构造 某 些 定义 良好 的 业务 活动 的 一 系列 步骤 。 医 院 的 “接纳 病人 ”和 制 

造 公司 的 “输入 顾客 订单 ”都 是 业务 事务 。 通 常 ， 一 个 业务 事务 包含 多 个 数据 库 操作 。 例 如 ， 
考虑 事务 “输入 顾客 订单 "。 当 输入 某 个 新 顾客 的 订单 时 ， 可 能 需要 通过 某 个 应 用 软件 程序 完 
成 以 下 步骤 : 

1) 输入 订单 数据 (由 用 户 键入 )。 

2) 读 取 CUSTOMER 记 录 (倘若 是 新 顾客 ， 就 插入 记录 )。 

3) 接受 或 者 拒绝 该 记录 。 如 果 Balance Due 加 上 Order Amount 不 超出 Credit Limit， 就 接受 
订单 ; 否则 就 拒绝 它 。 

4) 如 果 订 单 被 接受 ， 将 Order Amount 加 到 Balance Due 里 。 存储 更 新 后 的 CUSTOMER 记 录 。 
将 已 接受 的 ORDER 记录 插入 数据 库 里 。 

在 处 理事 务 时 ，DBMS 必 须 确保 该 事务 具备 称 之 为 ACID 性 质 的 以 下 四 个 广 为 接受 的 性 质 : 

“Atomic( 原 子 性 )， 意 味 着 该 事务 不 能 再 分 割 。 因 此 ， 它 要 么 整体 被 处 理 ， 要 么 完全 不 处 

理 。 一 旦 整个 事务 被 处 理 ， 我 们 就 称 变更 已 提交 。 如 果 该 事务 在 中 途 出 现 故障 ， 我 们 就 

称 它 中 止 。 例 如 ， 假 设 程序 正在 接受 一 份 新 顾客 的 订单 ， 就 加 上 Balance Due， 并 存储 此 

更 新 后 的 CUSTOMER 记 录 。 然 而 ， 假 如 新 ORDER 记录 播 入 不 成 功 (也 许 存在 重复 的 

Order Number 键 ， 也 许 物理 文件 空间 不 足 )。 在 这 种 情况 下 ， 我 们 希望 该 事务 的 任何 部 分 

都 不 会 影响 数据 库 。 

* Consistent (一致 性 )， 意 味 着 在 该 事务 处 理 前 为 真 的 数据 库 约束 在 该 事务 处 理 后 也 应 该 

为 真 。 例 如 ， 如 果 手 头 现 有 的 余额 恰好 是 总 收入 减 去 总 支出 之 差 ， 那么 它 在 订单 事务 发 

生 之 前 之 后 都 应 该 为 真 ， 它 就 会 扣 去 手头 余额 ， 以 满足 该 订单 。 

* Isolated (隔离 性 )， 意 味 着 对 于 数据 库 的 变更 直到 该 事务 提交 前 是 不 向 用 户 展示 的 。 例 

如 ， 这 一 性 质 表示 ， 直 到 库存 事务 完成 之 前 ， 其 他 用 户 是 不 知道 现 有 库存 的 。 因此 ， 这 

一 性 质 意 味 着 禁止 其 他 用 户 同时 进行 更 新 ， 甚至 于 不 能 读 取 正在 更 新 的 进程 里 的 数据 。 

我 们 以 后 将 在 并 发 控制 和 加 锁 中 更 详细 地 进行 讨论 这 方面 的 内 容 。 事务 彼此 相互 隔离 的 

后 果 是 ， 并 发 事务 ( 即 处 于 某 种 部 分 完成 状态 的 若干 事务 ) 就 仿佛 它们 是 以 种 行 方式 交 给 

DBMS 那 样 ， 将 全 部 影响 数据 库 。 

“Durable (持久 性 )， 意 味 着 变更 是 永久 性 的 。 因 此 ， 一 旦 某 个 事务 被 提交 ， 随后 的 任何 
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数据 库 故 障 ， 都 不 可 能 逆转 其 对 该 事务 的 影响 。 

为 了 维持 事务 的 完整 性 ，DBMS 必 须 向 用 户 或 应 用 软件 程序 提供 工具 来 定义 事务 边界 
(transaction boundary ) ， 即 事务 的 逻辑 起 点 和 终点 。 在 SQL 里 ，BEGIN TRANSACTION 语 句 放 
在 该 事务 内 第 一 个 SQL 命令 之 前 的 , 而 COMMIT 命 令 则 放 在 该 事务 的 最 后 。 在 这 两 个 命令 之 间 ， 
可 以 放 入 任意 多 个 SQL 命令 ; 前 面 说 过 ， 这 些 命令 就 是 完成 某 个 定义 良好 的 事务 话 动 的 数据 库 
处 理 步 骤 。 如 果 在 执行 BEGIN TRANSACTION 二 后、 执行 COMMIT 之 前 ， 需 要 处 理 某 个 命令 
(比如 ROLLBACK)， 则 DBMS 就 会 中 止 该 事务 ， 并 撤销 该 事务 边界 内 所 处 理 的 SQL 语句 的 影 
响 。 应 用 软件 就 像 是 编 好 了 程序 ， 仿 佛 在 该 事务 中 途 完 成 UPDATE 或 INSERT 命 令 中 ，DBMS 
产生 了 一 个 出 错 信息 时 ， 执 行 ROLLBACK 那 样 。 因 此 ，DBMS 对 于 成 功 的 事务 (它们 到 达 了 
COMMIT 语 句 ) 提交 (使 之 持久 ) 变更 ， 而 对 于 中 止 的 事务 (它们 遇 到 了 一 个 ROLLBACK ) 
则 拒绝 作出 变更 。 在 COMMIT 或 ROLLBACK 之 后 ， 并 且 在 BEGIN TRANSACTION 之 前 遇 到 的 
任何 SQL 语句 ， 将 其 作为 一 个 语句 事务 来 执行 ， 如 果 执 行 中 没有 错误 ， 就 自动 地 提交 ， 而 如 果 
执行 中 出 现任 何 错误 ， 就 被 中 止 。 

尽管 在 概念 上 事务 是 业务 工作 的 逻辑 单位 (比如 ， 一 份 顾客 订单 或 是 接收 供 货 商 的 新 
库存 ), 但 仍然 可 能 为 了 完成 数据 库 处 理 而 决定 把 该 业务 工作 单位 再 分 割 成 儿 个 数据 库 事务 。 
例如 ， 因 为 隔离 性 ， 一 个 包含 许多 命令 并 需要 很 长 处 理 时 间 的 事务 ， 会 禁止 其 他 用 户 在 同 
样 的 时 间 内 使 用 同样 的 数据 ， 从 而 延误 了 其 他 重要 的 (可 能 只 是 读 取 ) 工作 。 有 些 数据 库 
要 频繁 地 使 用 ， 所 以 尽 可 能 快 地 完成 这 些 在 所 谓 热点 数据 上 的 事务 工作 变 得 极其 重要 。 例 
如 ， 某 个 主键 及 其 银行 账号 索引 很 可 能 是 每 个 ATM 事 务 都 需要 访问 的 ， 所 以 必须 使 数据 库 
事务 能 迅速 使 用 和 释放 这 些 数 据 。 回 忆 一 下 ,在 事务 的 边界 之 间 的 所 有 命令 都 是 必须 执行 
的 ， 哪 怕 这 些 命 令 是 搜索 某 个 在 线 用 户 的 输入 。 倘 车 这 个 用 户 很 慢 地 响应 在 事务 边界 内 的 
输入 请 求 ， 其 他 用 户 就 可 能 会 遭 到 极 大 的 延迟 。 因 而 ， 只 要 可 能 ， 就 要 在 事务 开始 之 前 收 
集 所 有 的 用 户 输入 。 此 外 ,为 了 使 事务 的 长 度 最 小 化 ,在 事务 之 前 尽 可 能 早 地 检查 可 能 有 
的 错误 ， 比 如 重复 的 键 或 者 不 足 的 账户 余额 ， 这 样 ， 万 一 该 事务 可 能 中 止 ， 这 样 就 能 够 尽 
快 地 释放 出 这 部 分 数据 库 供 其 他 用 户 使 用 。 有 些 约 东 (如 收 到 事项 单位 数目 与 库存 退还 数 
日 的 平衡 ) 是 不 能 在 许多 数据 库 命令 执行 之 前 检查 的 ， 所 以 事务 必须 有 -- 定 长 度 ， 以 确保 
数据 库 完 整 性 。 因此， 生成 数据 库 事 务 的 指导 原则 是 ， 只 要 仍然 保持 数据 库 的 完整 性 ， 就 
尽 可 能 地 短 。 

4. 后 向 恢复 

DBMS 通 过 后 向 恢复 (backward recovery， 也 称 为 回 滚 ) 来 退出 或 撤销 不 想 要 的 数据 库 变 
更 。 正 如 图 12-7a 所 示 ， 把 已 经 变更 的 记录 的 前 象 应 用 于 数据 库 。 其 结果 是 ， 数 据 库 又 回复 到 
早先 的 状态 ， 不 想 要 的 变更 被 消除 了 。 

后 向 恢复 常用 于 恢复 由 被 中 止 或 者 异常 中 断 的 事务 所 作出 的 变更 上 。 为 了 详细 说 明 后 向 恢 
复 ( 或 UJNDO) 的 必要 性 ,假设 某 项 银行 事务 是 将 $100 从 顾客 A 的 账户 转账 到 顾客 B 的 账户 。 这 一 
过 程 的 步骤 如 下 所 示 : 

1) 程序 读 取 顾客 A 的 记录 ， 并 从 其 账户 余额 中 减 去 $100。 

2) 然后 程序 再 读 取 顾客 B 的 记录 ， 并 在 其 账户 余额 中 加 上 $100。 现 在 ， 程 序 把 顾客 A 的 更 
新 记录 写 和 数据库。 然而 ， 当 试图 把 顾客 B 的 记录 写 和 数据库 时 ， 读 程序 遇 到 了 某 个 错误 条 件 
(比如 磁盘 故障 )， 因 而 不 能 写 人 记录 。 现 在 数据 库 是 不 一 致 的 〈 记 录 A 已 经 更 新 ， 而 记录 B 却 
还 没有 )， 该 事务 必须 中 止 。UNDO 命 令 会 使 恢复 管理 器 应 用 记录 A 的 前 象 ， 把 账户 余额 复原 到 
其 原来 的 值 。( 恢 复 管理 器 可 能 再 重新 启动 该 事务 ， 再 作 另 一 次 尝试 。) 
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图 12-7 基本 恢复 技术 

5. 前 向 恢复 

DBMS 通 过 前 向 恢复 (forward recovery， 也 称 为 前 滚 ) 启用 该 数据 库 的 较 早 的 一 个 拷贝 。 
利用 (作为 良好 事务 结果 的 ) 后 象 ， 迅 速 使 数据 库 移 向 某 个 后 续 的 状态 (参见 图 12-7b)。 基 于 下 
列 理由 ， 前 向 恢复 要 比 复原 / 重 运 行 更 快 更 精确 : 

1) 不 必 重 复 重新 处 理 每 个 事务 的 费时 逻辑 。 

2) 只 需要 应 用 最 近 的 后 象 。 一 个 数据 库 记 录 可 能 会 有 一 系列 的 后 象 ( 作 为 一 系列 更 新 的 结 
果 )， 但 仅 有 最 近 的 “良好 ”后 象 才 是 前 滚 所 需要 的 。 

事务 的 不 同 顺序 的 问题 被 回避 了 ， 因 为 使 用 的 是 应 用 事务 的 结果 (而 不 是 事务 本 身 )。 
12.7.3 数据 库 故障 的 类 型 

在 处 理 数据 库 的 时 候 ， 有 可 能 会 出 现 各 种 故障 ， 包 括 输入 某 个 不 正确 的 数据 ， 直 到 数据 库 
崩溃 或 完全 丢失 。 四 种 最 常见 的 问题 是 ， 中 止 事 务 、 不 正确 的 数据 、 系 统 故 障 以 及 数据 库 委 失 
或 崩溃 。 以 下 各 节 将 分 别 描述 各 种 类 型 的 故障 ， 并 指出 其 可 能 的 恢复 过 程 (参见 表 12-1)。 

1. 中 止 的 事务 

正如 以 前 所 述 ， 完 成 一 个 事务 常常 要 执行 一 系列 的 处 理 步 骤 。 中 止 事 务 (aborted 
transaction ) 就 是 异常 的 中 断 。 造 成 这 类 故障 的 原因 包括 人 为 错误 、 输 入 不 正确 数据 、 硬 件 
故障 和 死 锁 (在 下 一 节 介绍 )。 硬 件 故 障 的 常见 类 型 是 在 事务 进行 过 程 中 出 现 通信 链 路 的 传输 
丢失 。 





党 12 拿 ”数据 管理 与 玫 据 摩 党 理 423 


表 12-1 对 数据 库 故障 的 响应 


故障 类 型 恢复 技术 
中 正事 务 癌 滚 (首选 ) 
前 深 / 重 运行 事务 直至 中 目前 的 状态 
不 正确 的 数据 pl 滚 (首选) 
(更 新 不 精 傅 ) 重新 处 理 带 不 精确 数据 更 新 的 事务 
赂 供 汕 务 
系统 故障 切换 至 备份 数据 库 ( 普 选 ) 
( 木 影响 数据 库 ) 十 凄 
从 检查 点 重启 动 
数据 库 崩 祸 切换 至 备份 数据 库 ( 首 选 ) 
前 深 
重新 处 理事 务 


当 某 个 事务 中 止 时 ， 我 们 需要 “退出 ”该 事务 ， 并 消除 对 于 数据 库 已 经 作出 (尚未 提交 ) 的 
任何 变更 。 恢 复 管理 器 是 通过 后 向 恢复 (对 问题 事务 应 用 前 象 ) 来 实现 这 一 点 的 。 这 个 功能 应 
当 由 DBMS 自 动 地 实现 ,然后 通知 用 户 修正 并 重新 提交 该 项 事务 。 也 可 以 应 用 其 他 的 过 程 (如 
前 滚 或 事务 重新 处 理 ) 使 数据 库 回 到 中 止 之 前 的 状态 ,但 回 滚 是 这 种 情况 下 首选 采用 的 过 程 。 

2. 不 正确 的 数据 

当 数 据 库 被 合法 但 不 正确 的 数据 更 新 时 ， 情 况 就 比较 复杂 一 点 。 例 如 ， 为 学 生 记录 了 一 个 
不 正确 的 成 绩 ， 或 者 对 某 个 顾客 应 付款 输入 了 不 正确 的 总 额 。 

不 正确 的 数据 是 很 难 检测 出 来 的 ， 经 常会 导致 混乱 。 检 测 错误 并 改正 数据 库 记录 会 消耗 大 
量 时 间 。 就 在 此 时 ， 也 许 已 经 有 很 多 其 他 用 户 使 用 过 这 些 错 误 数据 ， 于 是 ， 由 于 各 种 应 用 软件 
都 可 能 使 用 了 不 正确 的 数据 ， 因 而 会 出 现 一 系列 错误 的 反应 。 此 外 ， 基 于 这 些 不 正确 数据 而 产 
生 的 事务 输出 〈 比 如 文档 或 消息 ) 可 能 已 经 传递 给 了 用 户 。 例 如 ， 给 学 生发 送 了 一 份 不 正确 的 
分 数 报告 ， 或 者 给 顾客 发 送 了 一 段 不 正确 的 陈述 。 

企 已 经 导入 不 正确 的 数据 时 ， 数 据 库 可 以 采取 以 下 办 法 来 进行 恢复 : 

1) 如 果 错 误 发 现 得 比较 早 ， 就 可 以 采用 后 向 恢复 。( 然 而 ， 必 须 小 心 确保 所 有 的 后 续 错误 
都 已 被 纠正 。) 

2) 如 果 仅 仅 出 现 为 数 不 多 的 错误 ， 就 可 以 通过 人 为 的 干预 引入 一 系列 赔偿 事务 ， 以 校正 
错误 。 

3) 如 果 前 面 两 种 办 法 都 不 合适 , 那 就 只 能 从 出 现 错误 之 前 的 最 近 一 个 检查 点 开始 重新 启动 ， 
随后 的 事务 在 处 理 时 就 不 会 产生 错误 。 

几 是 由 错误 性 事务 所 产生 的 任何 错误 消息 或 报告 ， 都 应 当 通过 适当 的 人 为 干预 (解释 信 、 
打 电 话 等 等 ) 加 以 纠正 。 

3. 系统 故障 

在 系统 故障 中 ， 该 系统 的 某 个 组 件 失 效 ， 但 数据 库 并 没有 遭 到 破 害 。 系 统 故障 的 原因 包括 
掉 电 、 操 作 错 误 、 通 信 传 输 损失 以 及 系统 软件 故障 等 。 

当 系 统 崩 涡 时 ， 可 能 正在 处 理 某 些 事务 。 恢 复 的 第 一 步 就 是 利用 前 象 ( 后 向 恢复 ) 退出 这 
些 事务 。 然 后 ， 倘 车 系统 已 经 进行 镜像 ， 就 可 以 切换 到 其 镜像 数据 ， 并 在 一 个 新 的 磁盘 上 重新 
建立 被 破坏 的 数据 。 倘 若 该 系统 没有 被 镜像 ， 那 么 因为 在 主 存 里 的 状态 信息 已 丢失 或 损坏 ， 所 
以 无 法 重新 启动 。 最 安全 的 做 法 是 从 系统 故障 前 的 最 近 一 个 检查 点 开始 重新 启动 。 对 于 检查 点 
后 需要 处 理 的 所 有 事务 ， 数 据 库 是 应 用 后 象 进行 前 滚 的 。 
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4. 数据 库 盎 清 

在 数据 库 崩 溃 (database destruction ) 的 情况 下 ， 数 据 库 本 身 已 经 丢失 、 被 破坏 ， 或 者 不 
能 读 取 了 。 数 据 库 崩溃 的 典型 的 原因 是 磁盘 驱动 器 故障 (或 磁头 毁坏 )。 

对 于 这 类 事件 的 恢复 ， 其 首选 策略 也 是 利用 数据 库 的 镜像 拷贝 。 倘 若 没 有 镜像 拷贝 ， 则 需 
要 一 个 数据 库 的 备份 拷贝 。 前 向 恢复 用 来 将 数据 库 复 原 到 出 现 丢 失 前 的 状态 。 在 数据 库 丢 失 时 
下 处 于 进行 中 的 任何 事务 都 可 以 被 重新 启动 。 


12.8 并 发 访问 的 控制 


数据 库 是 共享 的 资源 。 数 据 库 管 理 必须 为 同时 有 多 个 用 户 试 图 访问 和 加 工 处 理 数据 作 好 规 
划 。 由 于 涉及 到 更 新 的 并 发 处 理 ， 所 以 一 个 数据 库 要 是 没有 并 发 性 控制 (concurrency control)， 
则 将 会 由 于 用 户 之 间 的 干扰 而 麻烦 不 堪 。 并 发 性 控制 有 两 种 实现 办 法 ， 一 种 是 悲观 的 方法 ( 利 
用 加 锁 )， 另 一 种 是 乐观 的 方法 (利用 版 本 设置 )。 我 们 将 在 以 后 的 内 容 中 介绍 这 两 种 方法 。 

绝 大 多 数 DBMS 是 在 多 用 户 环境 下 运行 的 ， 用 户 希 望 在 这 种 环境 下 能 够 共享 包含 在 数据 库 
里 数据 。 倘 车 用 户 只 是 读 取 数据 ， 就 不 会 遇 到 任何 数据 完整 性 问题 ， 因 为 数据 库 并 没有 任何 的 
变化 。 然 而 ， 如 果 有 一 个 或 多 个 用 户 在 更 新 数据 ， 那 么 就 会 遇 到 维护 数据 完整 性 的 问题 。 当 同 
时 处 理 多 个 数据 库 的 事务 时 ， 该 项 事务 被 看 成 是 并 发 的 。 用 于 确保 维持 数据 完整 性 的 操作 称 为 
并 发 性 控制 操作 。 回 想 一 下 ，CPU 每 次 只 能 处 理 一 条 指令 。 当 提交 某 个 新 事务 时 还 有 其 他 也 是 
针对 该 数据 库 的 处 理 ， 那 么 通过 CPU 在 事务 之 间 的 切换， 使 得 CPU 轮流 访问 每 个 事务 ， 从 而 完 
成 每 个 事务 的 某 个 部 分 。 因 为 CPU 能 够 非常 快 地 在 事务 之 间 切 换 ， 所 以 绝 大 多 数 用 户 都 不 会 感 
觉 到 他 们 是 在 和 其 他 用 户 分 享 着 CPU 时 间 。 

12.8.1 更 新 丢失 的 问题 

在 没有 足够 的 并 发 性 控制 条 件 下 ， 多 个 用 户 试图 更 新 某 个 数据 库 所 遇 到 的 最 普遍 的 问题 就 

是 更 新 的 丢失 。 图 12-8 显 示 了 一 种 很 常见 的 情景 。John 和 Marsha 拥 有 一 个 联名 支票 账户 ， 两 个 





时 间 
John Marsha 
| 
1. 读 取 账户 余额 
(余额 =$1000) 
1. 读 取 账 户 余额 
(余额 =$1000) 
2. 取款 $200 
(余额 =$800) 
2. 取款 $300 
(余额 =$700) 
3. 写 入 账户 余额 | 
(余额 = $800) 3. 写 人 账户 余额 
(余额 =$700) 


图 12-8 更 新 的 丢失 (没有 任何 并 发 性 控制 的 结果 ) 
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人 同时 想 要 提取 一 些 现金 ， 他 们 在 不 同 的 地 点 使 用 ATM 终 端 。 图 12-8 显 示 了 在 缺少 并 发 性 控制 
机 制 时 ， 可 能 会 出 现 的 事件 序列 。John 的 事务 读 取 账户 余额 (为 $1000)， 然 后 他 取款 $200。 在 
该 事务 写 人 新 账户 余额 ($800) 前 ，Marsha 的 事务 读 取 了 账户 余额 〈 仍 是 $1000)。 然 后 她 取款 
$300， 此 时 余额 为 $700。 她 的 事务 然后 写 入 这 个 账户 余额 ， 这 替换 了 John 事 务 所 作 的 写 和 人 操作。 
John 的 更 新 被 丢失 的 结果 是 由 于 事务 之 间 的 干预 造成 的 ， 银 行当 然 不 希望 出 现 这 种 情况 。 

在 不 建立 并 发 性 控制 时 ， 可 能 会 出 现 的 另 一 个 类 似 问题 是 不 一 致 读 问题 (inconsistent read 
problem )。 这 个 问题 在 一 个 用 户 读 取 已 经 被 其 他 用 户 部 分 地 更 新 的 数据 时 出 现 。 这 种 读 取 是 不 
正确 的 ， 所 以 有 时 也 称 为 脏 读 或 者 不 可 重复 读 。 当 DBMS 设 有 隔离 事务 ( 事务 的 ACID 性 质 的 
一 部 分 ) 时 ， 就 会 遇 到 更 新 丢失 和 不 一 致 读 问题 。 

12.8.2 可 串 行 性 

并 发 的 事务 应 该 按 隔 离 方式 处 理 ， 使 得 它们 不 会 彼此 相互 和 干扰。 如果 在 处 理 其 他 事务 之 前 
可 以 完整 地 处 理 完 前 一 个 事务 ， 那 么 就 不 会 发 生 干 扰 。 处 理事 务 时 ， 其 结果 与 前 面 所 描述 的 情 
丸 一 样 ， 那 么 该 过 程 被 称 为 是 可 串 行 性 的 。 利 用 某 个 可 串 行 性 方案 来 处 理事 务 ， 其 结果 就 像 是 
一 个 紧 接着 另 一 个 处 理 的 。 只 要 计划 方案 设计 得 事务 不 会 彼此 干扰 ， 那 么 事务 仍然 可 以 并 行 地 
运作 。 例 如 ， 从 数据 库 的 不 同 表 中 请 求 数据 的 事务 就 不 会 彼此 冲突 ， 它 们 可 以 并 发 地 运作 ， 而 
不 会 产生 数据 完整 性 问题 。 可 串 行 性 可 以 通过 不 同 的 手段 实现 ， 但 加 锁 机 制 是 最 常见 的 并 发 性 
控制 机 制 。 利 用 加 锁 (locking) 机 制 ， 用 户 为 了 更 新 而 检索 的 任何 数据 ， 必 须 加 以 锁定 ， 即 直 
到 更 新 完成 或 中 止 之 前 ， 拒 绝 其 他 的 用 户 。 数 据 加 锁 就 像 是 从 图 书馆 里 查 出 一 本 书 ， 在 其 借阅 
者 归还 之 前 ， 其 他 人 是 无 法 得 到 的 。 

12.8.3 加 锁 机 制 

图 12-9 显 示 了 采用 记录 锁 来 维持 数据 完整 性 的 情况 。John 启 动 从 某 个 ATM 提 款 的 事务 。 由 
于 John 的 事务 需要 更 新 其 记录 ， 应 用 软件 程序 在 将 其 读 入 主 存 之 前 ， 先 锁定 该 记录 。John 继 续 
提 款 $200， 然 后 计算 出 新 的 余额 ($800)。 在 John 的 事务 开始 不 久 ，Marsha 启 动 了 一 个 提 款 事务 ， 
但 她 的 事务 在 John 事 务 把 更 新 记录 归还 给 数据 库 ， 并 对 该 记录 解锁 之 前 是 无 法 访问 该 账户 记录 
的 。 因 此 ， 加 锁 机 制 强制 实现 了 一 个 有 序 的 更 新 过 程 ， 防 止 错误 的 更 新 。 

1. 加 锁 等 级 

实现 并 发 性 控制 的 一 个 重要 因素 是 选取 加 锁 等 级 。 加 锁 等 级 (locking level， 又 称 为 粒度 
(granularity ) ) 就 是 每 次 锁定 所 包括 的 数据 库 资 源 的 范围 。 绝 大 多 数 商用 产品 都 在 下 述 基 个 级 
别 上 进行 加 锁 : 

1) 数据 库 整个 数据 库 被 锁定 ， 其 他 用 户 都 不 能 使 用 该 数据 库 。 这 一 级 别 的 应 用 软件 很 少 ， 
例如 在 对 整个 数据 库 作 备份 时 所 用 的 软件 〈 见 Rodgers,1989 ) 。 

2) 表 锁定 包含 所 请 求 记录 的 整个 表 。 这 一 级 别 主要 适合 于 更 新 整个 表 的 批量 更 新 ， 例 如 
将 所 有 的 员工 薪水 增加 5% 之 类 。 

3) 块 或 页 锁定 包含 所 请 求 记录 的 物理 存储 块 (或 页 )。 这 是 最 常 实现 的 加 锁 级 别 。 页 有 固 
定 的 大 小 (4K、8K 等 )， 并 能 包含 多 种 类 型 的 记录 。 

4) 记录 级 仅 锁定 所 请 求 的 一 个 记录 (或 一 行 )。 其 他 的 记录 (即使 是 该 表 内 的 )， 都 可 以 
供 其 他 用 户 使 用 。 当 一 次 更 新 涉及 几 个 记录 时 ， 在 运行 时 要 强制 一 些 负载 。 

5) 字段 级 仅仅 锁定 所 请 求 记录 的 特定 的 字段 (或 列 )。 当 大 部 分 更 新 最 多 影响 记录 里 的 一 
个 或 两 个 字段 时 ， 这 一 级 锁定 可 能 是 最 合适 的 。 例 如 在 库存 控制 应 用 软件 中 ， 现 有 数量 字段 会 
经 常 修改 ， 但 其 他 字段 〈 比 如 描述 字段 或 存储 箱 位 置 字段 ) 不 经 常 被 更 新 。 字 段 级 锁定 需要 相 
当 大 的 开销 ， 因 此 很 少 使 用 。 





426 党 五 部 分 娄 据 府 的 高 级 主题 





John 时 间 Marsha 


1. 请求 账户 余 客 
2. 加 锁 账 户 余 额 
1. 请 求 账户 余额 
3. 读 取 账户 余额 

(余额 = $1000) 


4. 提 到 $200 
(余额 = $800) 

5. 写 账 户 余额 
(余额 = $800) 





6. 对 账 产 余额 解锁 
2. 加 锁 账 户 余 额 
3. 读 取 账户 余额 
4. 提取 $300 
(余额 =$500) 


5. 5 账户 余额 
(余额 =$500) 








6. 对 账户 余额 解锁 


= 


图 12-9 采用 加 锁 的 更 新 (并 发 性 控制 ) 


2. 锁 的 类 型 

迄今 为 止 ， 我们 仅仅 讨论 了 防止 对 锁定 项 目 进 行 访问 的 加 锁 。 其 实 ， 数 据 库 管 理 员 一 般 可 
以 在 两 种 类 型 的 锁 中 进行 选择 : 共享 锁 和 排他 锁 。 

1) 共享 锁 共享 锁 (也 称 为 S 锁 或 读 锁 ) 允许 其 他 事务 读 取 (但 不 是 更 新 ) 记录 或 者 其 他 资 
源 。 当 一 个 事务 仅仅 是 读 取 而 不 是 更 新 一 条 记录 或 数据 资源 的 时 候 ， 应 当 在 其 上 放置 一 个 共享 
锁 。 在 一 条 记录 上 放置 共享 锁 防 止 了 另外 的 用 户 在 其 上 放置 排他 锁 (而 不 是 共享 锁 )。 

2) 排他 锁 排他 锁 (也 称 为 X 锁 或 写 锁 ) 能 防止 其 他 事务 读 取 (包括 更 新 ) 记录 ， 直 到 解 
锁 为止 。 当 准备 更 新 记录 时 ， 事 务 就 应 当 在 记录 上 设置 排他 锁 ( 见 Descollonges. 1993)。 在 一 
个 记录 上 设置 排他 锁 能 够 防止 其 他 用 户 对 该 记录 再 设置 其 他 类 型 的 锁 。 

图 12-10 显 示 了 将 共享 锁 和 排他 锁 应 用 于 检查 账户 的 例子 。 当 John 启 动 其 事务 时 ， 程 序 在 
他 的 账户 记录 上 设置 一 个 读 锁 ， 因 为 他 正在 读 取 记 录 ， 以 检查 账户 余额 。 当 John 请 求 提 款 时 ， 
程序 试图 在 该 记录 上 设置 一 个 排他 锁 〈 写 锁 ) ， 因 为 这 是 一 个 更 新 操作 。 然 而 ， 如 图 所 示 ， 
Marsha 已 经 启动 她 的 事务 ， 该 事务 在 同一 个 记录 上 设置 一 个 读 锁 。 结 果 ，John 的 请 求 被 拒绝 了 。 
请 记 住 ， 倘 车 有 一 个 记录 是 读 锁 ， 则 其 他 用 户 就 不 能 获得 写 锁 。 

3. 死 锁 

加 锁 解 决 了 错误 更 新 的 问题 ， 但 又 可 能 会 导致 另外 一 个 所 谓 死 锁 (deadlock) 的 问题 ， 即 
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两 个 或 更 多 的 事务 都 锁定 某 个 共同 的 资源 ， 而 每 个 事务 都 在 等 待 他 人 释放 该 资源 的 一 种 从 局。 
图 12-10 显 示 了 简单 的 死 锁 例 子 。John 的 事务 在 等 待 Marsha 事 务 消除 对 该 账户 记录 的 读 锁 ， 反 
之 亦 然 。 尽 管 余额 大 大 超出 实际 所 需 ， 但 他 们 两 人 都 无 法 提 款 。 


时 问 








Jonn : Marsha 
| 
1. 设 帝 读 锁 
2. 检查 余额 
(余额 =$1000) 于 1. 设置 读 锁 
| 
一 十 一 2. 松 术 余额 
人 A ~ 
3， 请 求 5 锁 ( 额 -$1000) 
3. 请求， 镇 
a 
( 生得 
(等待 


图 12-10 和 死 锁 的 例子 


图 12-11 显 示 了 一 个 稍微 复杂 的 死 锁 的 例子 。 其 中 , 用 户 A 锁 定 记 录 X， 而 用 户 B 锁 定 记录 Y。 
然后 ， 用 户 A 请 求 记录 Y (打算 更 新 )， 而 用 户 B 则 请 求 记录 X (也 是 打算 更 新 )。 两 个 请 求 都 遭 
到 拒绝 ， 因 为 所 请 求 的 记录 已 经 被 锁 住 。 除 非 DBMS 干 预 ， 否 则 两 个 用 户 都 将 无 限 地 等 待 下 去 。 


ft] 
用 户 A 用 户 B 


1 锁 住 记录 X 1. 锁 住 记录 Y 
2. 请 求 记 2. 请 求 记录 X 
( 等 待 Y) {等 待 X) 


图 12-11 另 一 个 死 锁 的 例子 
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4. 死 锁 的 管理 

解决 死 锁 有 两 种 基本 方法 ， 即 死 锁 预防 和 死 锁 化 解 。 当 采用 死 锁 预防 (deadlock 
prevention) 时 ， 用 户 程 序 必 须 在 事务 一 开始 ， 锁 定 它 所 需要 的 所 有 记录 ， 而 不 是 每 次 锁定 一 
条 记录 。 在 图 12-11 里 ， 用 户 A 应 当 在 处 理事 务 前 先 锁定 记录 X 和 YY。 倘若 两 条 记录 都 已 被 锁定 ， 
程序 就 必须 等 待 ， 直 到 它们 被 释放 为 止 。 凡 是 在 任何 资源 被 解锁 之 前 ， 又 出 现 需 要 加 锁 操 作 的 
地 方 ， 就 要 应 用 一 个 两 阶段 加 锁 协 议 (two-phase locking protocol)。 一 旦 释放 了 该 事务 的 任何 
锁 ， 就 不 需要 再 加 锁 。 从 而 ， 在 两 阶段 加 锁 协 议 里 的 阶段 ， 通 常 一 个 称 为 增长 阶段 (其 时 需求 
着 所 有 必要 的 锁 ), 而 另外 一 个 称 为 收缩 阶段 (其 时 所 有 的 锁 在 释放 着 ) 。 锁 不 应 该 被 同时 请 求 。 
经 常 出 现 的 情况 是 ， 请 求 某 些 锁 ， 进 行 处 理 ， 然 后 又 请 求 所 需 的 其 他 锁 。 

在 事务 一 开始 时 就 锁定 所 有 需要 的 记录 ( 称 为 保守 的 两 阶段 加 锁 ) 可 以 预防 死 锁 。 但 是 ， 
通常 很 难 预 测 在 处 理 某 个 事务 时 下 一 步 会 需要 哪些 记录 。 上 典型 的 程序 都 有 许多 处 理 部 分 ， 并 可 
能 以 不 同 的 顺序 调用 其 他 程序 。 其 结果 是 ， 死 锁 预 防 并 不 实用 的 。 

在 两 阶段 加 锁 中 ， 每 个 事务 都 必须 按 相同 的 顺序 请 求 记 录 ( 即 对 资源 串 行 化 )， 这 样 也 能 
够 预防 死 锁 ， 但 这 也 并 不 实用 。 

第 .种 较 常 用 的 方法 是 允许 死 锁 出 现 , 但 在 DBMS 里 建立 检测 和 打破 死 锁 的 机 制 。 实 质 上 ， 
死 锁 化 解 (deadiock resolution) 机 制 的 工作 原理 如 下 。DBMS 维 护 着 一 个 资源 使 用 和 矩阵， 它 能 
在 某 个 瞬间 指出 哪些 主体 〈 用 户 ) 在 使 用 哪些 对 象 (资源 )。 通 过 扫描 这 个 年 阵 、 计 算 机 就 能 
够 检测 到 是 否 出 现 了 死 锁 。DBMS 然 后 便 通过 “撤销 ” 某 个 被 死 锁 的 事务 ， 来 化 解 该 死 锁 。 该 
项 事务 直到 死 锁 前 所 作出 的 任何 变更 都 将 消除 ， 等 到 其 请 求 的 资源 变 为 可 用 时 ， 再 重新 启动 访 
项 事务 。 我 们 后 面 将 很 快 再 详细 描述 这 个 过 程 。 

12.8.4 版 本 设置 

这 时 所 描述 的 加 锁 通 常 被 称 为 悲观 (pessimistic) 并 发 性 控制 机 制 ， 因 为 每 次 只 请 求 一 个 
记录 ，DBMS 采 取 密 切 注意 被 锁定 记录 的 方法 ， 使 得 其 他 程序 不 能 再 使 用 它 。 其 实 ， 在 大 多 数 
情况 卜 ， 其 他 用 户 不 会 去 请 求 同 一 个 文档 ， 或 者 它们 可 能 只 是 需要 读 取 一 下 ， 那 是 没有 问题 的 
( 见 Celko,1992)。 因 此 ， 冲 突 是 很 少 的 ， 一 种 较 新 的 并 发 性 控制 方法 (被 称 为 版 本 设置 ， 
versioning ) 则 是 采取 乐观 (optimistic) 的 方法 ， 大 多 数 时 间 里 其 他 用 户 是 不 会 需要 则 一 个 记 
录 的 ， 即 便 他 们 要 求 该 记录 ， 那 也 只 是 要 求 读 取 (并 非 更 新 ) 此 记录 。 利 用 版 本 设置 ， 就 不 再 
需要 任何 形式 的 加 锁 。 在 事务 开始 时 ， 每 个 事务 都 约束 限制 于 数据 库 的 一 个 视图 ， 在 某 个 事务 
修改 记录 时 ，DBMS 就 创建 一 个 新 的 记录 版 本 ， 和 覆盖 赫 代 旧 的 记录 。 

理解 版 本 设置 的 最 好 办 法 就 是 将 数据 库 看 作 一 个 中 央 记 录 室 ( 见 Celko,1992 )。 该 记录 室 
有 一 个 服务 窗口 。 用 户 (对 应 于 事务 ) 到达 该 窗口 ， 并 请 求 文档 (对 应 于 数据 库 记 录 )。 然 而 ， 
原始 的 文档 从 不 离开 该 记录 室 。 相 反 ， 职 员 (对 应 于 DBMS) 为 所 请 求 文档 制 做 拷贝 ， 并 给 它 
益 上 时 间 戳 。 用 户 随 后 取 走 其 私人 的 文档 拷贝 (或 版 本 )， 回 到 其 工作 地 进行 阅读 或 修改 。 当 
完成 时 ， 他 们 把 打 过 标记 的 拷贝 归 还 给 中 央 数 据 库 。 在 没有 任何 冲突 的 情况 下 (例如 ， 只 有 一 
个 用 户 对 一 组 数据 库 记 录 作 过 变更 )， 该 用 户 所 作 的 变更 就 会 直接 合并 到 公共 (或 中 类) 数据 
库 里 去 。 

假设 存在 冲突 。 例 如 ， 两 个 用 户 对 其 私人 数据 库 拷贝 作出 了 相互 矛盾 的 变更 。 此 时 ， 其 中 
多 地 放空 更 已 经 提交 给 数据 库 了 《 (请 记 住 ， 事 务 都 是 盖 有 时 间 戳 的 ， 早 的 事务 能 够 优 
先 提 交 )。 另 一 个 用 户 必须 被 告知 存在 冲突 ， 他 的 工作 不 能 被 提交 (或 者 不 能 合并 到 中 央 数 据 
库 )。 他 世 项 并 出 数据 包 及 的 所 个 拷贝 ， 并 重复 原先 的 工作 。 不 过 ， 这 类 重复 工作 是 极 少 数 
的 异常 情况 ， 而 不 是 经 常 发 生 的 。 
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图 12-12 显 示 了 利用 版 本 来 检查 账户 的 简单 例子 。John 读 取 包 含 账户 余额 的 记录 ， 成 功 地 
提取 了 $200， 而 新 的 余额 ($800) 通过 COMMIT 语 句 发送 到 账户 。 其 间 ，Marsha 也 已 读 取 该 
账户 余额 ， 并 请 求 提 款 ， 该 请 求 发送 到 她 账户 记录 的 本 地 版 本 。 然 而 ， 当 此 事务 试图 COMMIT 
上 时 发 现 了 更 新 冲突 ， 于 是 她 的 事务 中 止 〈 或 许 出现 “ 不 能 在 此 时 完成 事务 ”之 消息 )。 她 然后 
从 正确 的 新 初始 余额 $800 重 新 启动 其 事务 。 

时 和 问 


John Marsha 
1. 谈 取 余额 
(余额 =$1000) 
]. 读 取 余额 
(余额 =$1000) 
2. 取 网 $200 
条 =$800 
(余额 =$800) 2 淮 试 取款 9300 








ys 
3. 提交 3. 上 | 深 


4. 重新 启动 事务 


图 12-12 版 本 设置 的 用 法 


版 本 设置 相对 于 加 锁 的 主要 优势 在 于 性 能 上 的 改善 。 只 读 事务 可 以 与 更 新 事务 并 发 地 运行 ， 
而 不 会 损失 数据 库 的 一 致 性 。 


12.9 数据 质量 的 管理 


今天 ， 组 织 管理 的 基础 是 高 质量 的 数据 ， 即 精确 的 、 一 致 的 并 能 及 时 使 用 的 数据 。 组 织 必 
须 尽 可 能 标识 出 适宜 于 其 决策 制定 的 数据 ， 开 发 确保 数据 精确 性 与 完备 性 的 业务 策略 与 规程 ， 
并 提供 全 企业 范围 的 数据 共享 。 

建立 一 个 由 代表 每 个 主要 业务 部 门 的 有 权 制 定 业务 策略 的 人 员 所 组 成 的 业务 信息 咨询 委员 
会 ， 对 于 建立 高 质量 的 数据 是 非常 作用 的 ( 见 Moriarty，1996)。 这 些 委员 会 成 员 是 IT 和 其 业务 
部 门 之 间 的 联系 人 ， 他 们 考虑 的 不 仅 是 本 职能 部 门 的 信息 需求 ， 而 且 包 括 全 企业 范围 的 数据 需 
求 。 委员会 的 成 员 必 须 具有 把 信息 作为 企业 资源 进行 管理 的 强烈 兴趣 , 深刻 理解 该 组 织 的 业务 ， 
并 具有 良好 的 协调 能 力 。 这 些 成 员 有 时 候 可 称 为 数据 管家 ( data steward) ， 即 负责 确保 组 织 内 
的 应 用 软件 正确 支持 该 组 织 企业 目标 的 人 员 。 他 们 也 必须 确保 所 获得 的 数据 都 是 精确 的 ， 在 整 
个 组 织 内 是 一 致 的 ， 这 样 ， 整 个 组 织 的 用 户 都 能 够 依靠 其 数据 。 

建立 企业 范围 内 的 数据 质量 标准 并 不 容易 ， 甚 至 于 还 会 有 某 些 业务 机 构 和 规程 会 影响 数据 
质量 〈 见 Moriarty, 1996)。 在 设立 彼此 竞争 的 战略 性 业务 部 门 的 组 织 内 ， 数 据 共享 可 能 是 很 困 
难 的 ， 因 为 每 个 战略 性 业务 部 门 都 力求 保护 其 竞争 地 位 。 有 些 正规 的 产业 ( 如 银行 和 通信 业 ) 
可 以 合法 地 限制 能 够 共享 的 数据 量 。 维 护 高 质量 数据 的 另 一 种 威胁 可 能 是 : 数据 记录 会 受到 奖 
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励 计 划 的 引诱 ， 或 是 建立 在 完成 工作 量 基 础 上 的 定额 系统 。 那 时 ， 实 现 高 速 数 据 和 输入 的 需求 可 
能 会 压倒 对 于 数据 精确 性 的 要 求 。 凡 是 从 一 个 以 上 业务 部 门 收集 来 的 需要 共享 的 数据 ， 其 不 精 
确 性 和 不 -- 致 性 的 比例 是 相当 惊人 的 。 必 须要 开发 出 处 理 上 述 问 题 的 策略 。 

除了 处 理 上 述 问题 之 外 ， 任 何 组 织 都 需要 处 理 关 系 到 实现 高 质量 数据 的 五 个 方面 : 

1) 安全 性 策略 和 灾难 恢复 。 

2) 人 员 控 制 。 

3) 物理 访问 控制 。 

4) 维护 控制 。 

5) 数据 保护 和 私密 性 。 

12.9.1 安全 性 策略 与 灾难 恢复 

每 个 组 织 〈 无 论 大 小 ) 都 应 当 建 立 起 全 面 的 安全 性 策略 ， 并 制定 详细 的 灾难 恢复 计划 。 安 
全 性 策略 将 决定 组 织 如 何 维持 一 个 安全 系统 。 灾 难 恢复 计划 将 确定 组 织 在 过 到 潜水 或 火灾 之 类 
的 紧急 情况 时 ， 应 当 如 何 继续 执行 其 职能 。 

应 当 编 写 安 全 性 策略 以 提供 关于 哪些 地 方 需 要 有 安全 性 措施 的 指导 。 应 当 根据 已 建立 的 策略 
确定 员工 的 职责 和 义务 ， 并 应 当 指 出 不 遵循 策略 所 带 来 的 后 果 。 最 后 ， 还 应 当 指 出 实施 这 些 指导 
所 需要 采取 的 一 般 过 程 。 这 些 一 般 过 程 将 通过 更 专门 的 过 程 来 实现 ， 当 开发 使 用 新 的 技术 或 者 开 
发 出 加 强 安全 性 环境 的 新 产品 时 ， 这 些 过 程 是 策略 中 最 可 能 需要 随 着 时 间 推 移 而 变更 的 部 分 。 

灾难 恢复 计划 应 当 在 可 能 预见 的 任何 灾难 出 现 以 前 就 详细 地 制定 出 来 , 并 尽 可 能 地 加 以 测试 。 
例如 ，1993 年 Andrew 飓 风 袭 击 了 迈阿密 地 区 ，Tampa Bay 公 司 启动 了 他 们 的 飓风 灾难 恢复 计划 。 
结果 ， 有 些 组 织 发 现 ， 他 们 利用 航班 把 数据 磁带 送 往 安 全 地 点 的 计划 根本 不 现实 ， 于 是 他 们 利用 
这 个 机 会 改进 了 飓风 灾难 恢复 计划 。 应 急 计划 必须 考虑 到 向 其 他 地 点 的 转移 过 程 和 安全 措施 中 的 
数据 、 设 备 、 人 员 以 及 管理 问题 。 计 划 的 拷贝 应 当 保存 在 多 个 地 方 ， 并 定期 加 以 查看 。 

表 12-2 数据 库 保护 过 程 
一 -一 一 ~ 
备份 和 开发 环境 

磁带 备份 为 找 出 备份 磁带 设 定 正 式 的 过 程 

磁盘 备份 最 大 限度 防止 未 授权 使 用 数据 库 所 涡 鉴 的 磁盘 备份 和 克 余 (RAID) 挡 页 

开发 数据 库 如 果 它 们 包含 实际 数据 ， 则 必须 对 程序 员 、 开 发 者 、 吕 接受 的 测试 者 以 及 与 系统 开发 有 关 用 户 进行 

控制 ， 使 得 数据 不 向 设 有 相应 权限 或 不 需要 知道 的 人 员 展 示 

系统 与 专用 账户 

这 些 账户 (如 由 DBMS 提 供 的 系统 管理 账户 SYSMANAGER 和 DBA， 以 及 用 于 系统 测试 的 账 力 ) 往 往 比 典型 的 用 户 

各 开发 者 账户 拥有 更 高 的 权限 。 这 些 用 户 ID 和 品 今 必须 加 以 保护 (也 必须 加 以 记录 )、 使 得 它们 只 能 授予 有 相应 权 

限 的 人 员 

数据 库 名 与 位 置 

建议 对 所 有 的 物理 数据 库 对 象 都 使 用 别名 ， 以 尽 可 能 地 隐藏 数 据 的 实际 位 置 。 这 一点 也 在 不意 前 而 讨论 的 用 户 

视图 中 得 到 强调 

系统 文件 

这 些 文件 包含 敏感 的 数据 库 数 据 、 比 如 用 户 ID、 数 据 位 置 、 字 段 描述 以 及 其 他 的 数据 词典 内 容 等 等 。 必 须 保护 

这 此 内容， 防止 它们 被 破坏 或 非 授权 使 用 。 -种 策略 是 .将 这 些 文件 存储 到 与 实际 数据 库 不 同 的 设备 上 ， 可 以 由 

操作 系统 采取 额外 级 别 的 保护 ， 并 设 定 对 这 些 设备 的 物理 访问 

口令 控制 

设 痊 口 令 使 其 经 过 … 段 时 间 后 失效 ， 从 而 强制 所 有 的 数据 库 用 户 定期 地 变更 口 今 。 这 可 以 大 大 地 限制 失 窍 或 不 

愉 当 共享 口 今 的 责任 


隔离 数据 库 
将 不 加 的 生产 以 及 咎 产 与 测试 数据 库 分 别 图 本 单独 的 环境 中 ， 开 对 每 -个 数据 库 采用 单独 的 归 务 器 和 和 铝 作 系统 
级 安全 性 


一 一 


注 : 本 表 摘 自 Loney(2000)。 
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大 型 的 组 织 可 能 都 安排 有 空间 (一 个 冷场 所 )， 以 便 在 发 生 灾难 事件 时 使 用 ， 该 地 点 可 以 和 
组 织 位 于 同样 的 物理 地 区 ， 也 可 以 位 于 与 组 织 所 在 地 相隔 遥远 的 某 个 地 区 。 有 时 候 ， 一 个 组 织 
会 在 某 个 暖 场所 投资 ， 其 中 包含 建立 计算 机 操作 所 必需 的 所 有 设备 。 也 有 的 组 织 维持 某 个 热 场 
所 ， 其 中 运作 是 按 双 份 配备 的 一旦 一 个 系统 过 到 问题 ， 立 即 可 以 切换 到 另外 一 个 系统 。 

上 述 讨论 强调 ， 在 安全 性 受 损 或 者 灾难 事件 中 ， 为 了 保护 数据 库 环 境 所 必需 的 几 个 重要 的 
过 程 和 策略 。 表 12-2 总 结 了 一 些 专门 过 程 ， 它 们 配合 DBMS 所 提供 的 安全 性 命令 (如 视图 、 权 
限 、 用 户 账户 、 加 密 以 及 生物 设备 ) 使 用 ， 从 而 产生 一 份 全 面 的 数据 库 保 护 计划 。 

12.9.2 人 员 控 制 

必须 开发 和 遵循 完全 的 人 员 控 制 策略 ， 对 业务 安全 性 的 最 大 威胁 通常 是 来 自 内 部 而 不 是 外 
部 。 除 了 本 章 早 些 时 候 讨论 的 安全 性 授权 和 认证 过 程 以 外 ， 组 织 还 应 当 开 发 相应 的 过 程 来 确保 
一 个 有 选择 的 雇佣 程序 能 够 验证 员工 关于 背景 和 能 力 的 表现 。 要 监控 以 确保 人 员 遵 循 着 已 建立 
的 规程 、 享 用 正规 的 假期 、 能 够 与 其 他 员工 一 起 工作 等 等 。 员 工 应 当 接受 与 其 职位 相关 的 安全 
性 和 质量 方面 的 培训 ， 鼓 励 他 们 熟悉 并 遵守 标准 的 安全 性 和 数据 质量 控制 措施 。 应 当 强制 实施 
标准 的 作业 控制 。 例 如 分 离 责任 ， 这 样 使 得 没有 任何 个 人 要 对 整个 业务 过 程 负责 ， 或 者 使 应 用 
软件 开发 人 员 访问 生产 系统 。 如 果 一 个 员工 离开 ， 那 么 应 该 执行 一 系列 过 程 来 撤销 该 员工 的 授 
权 和 认证 ， 并 把 状态 的 变化 告知 其 他 员工 。 

12.9.3 物理 访问 控制 

限制 进出 办 公 楼 的 特定 区 域 ， 往 往 也 是 控制 物理 访问 的 一 部 分 。 包 括 硬件 和 外 围 设 备 在 内 
的 敏感 设备 ， 如 打印 机 它 也 能 用 来 打印 分 类 报表 )， 可 以 通过 将 其 放 在 安全 区 域 而 加 以 控制 。 
其 他 的 材料 可 以 锁 在 抽 导 或 柜子 里 ， 或 者 可 以 安装 一 个 报警 器 。 备 份 的 数据 磁带 应 当 保存 在 防 
火 的 数据 保险 箱 里 或 者 保存 在 其 他 的 安全 地 点 。 清 晰 标记 移动 媒介 和 处 置 媒介 的 日 程 计划 ， 并 
对 存放 的 所 有 物品 做 好 标记 和 索引 ， 诸 如 此 类 的 过 程 也 必须 确立 。 

计算 机 屏幕 放 在 适当 的 位 置 ， 使 得 从 办 公 楼 外 无 法 看 到 它 可 能 也 是 很 重要 的 。 还 应 当 开发 
一 个 对 办 公 楼 外 区 域 进行 控制 的 过 程 。 公 司 经 常 利用 保安 人 员 对 进出 办 公 楼 的 人 员 加 以 控制 ， 
或 者 采用 一 个 卡片 扫描 系统 或 指纹 识别 系统 使 员工 可 以 自由 进出 办 公 楼 。 可 以 给 来 访 者 发 放 标 
识 卡 ， 并 由 人 陪同 通过 大 楼 。 

12.9.4 维护 控制 

一 个 有 助 于 维护 数据 质量 ， 但 却 往 往 被 忽略 的 控制 领域 ， 就 是 维护 控制 。 组 织 应 当 审 查 它 
们 所 使 用 的 所 有 硬件 和 软件 的 外 部 维护 协议 ， 确 保 达 到 合适 的 响应 速率 ， 以 维护 数据 质量 。 考 
虑 与 所 有 关键 的 软件 开发 者 达成 协议 ， 使 得 组 织 得 以 能 够 访问 源 代码 也 是 很 重要 的 ， 以 防 开发 
者 结束 业务 或 者 停止 对 程序 的 支持 。 实 现 上 述 目标 的 办 法 之 一 是 ， 让 某 个 第 三 方 持 有 源 代 码 ， 
并 订立 协议 ， 一旦 出 现 这 类 开发 情况 ， 便 可 发 布 该 程序 。 

12.9.5 数据 保护 与 私密 性 

随 着 越 来 越 多 的 人 开始 熟悉 计算 机 以 及 计算 机 通信 的 不 断 增 加 ， 人 们 越 来 越 关心 不 得 随意 
收集 和 散布 私人 信息 方面 的 个 人 权利 。 信 息 私 密 性 法 规 通常 规定 个 人 有 权 了 解 收集 了 他 们 的 哪 
些 数据 ， 并 校正 这 些 数据 中 的 任何 错误 。 因 为 被 交换 的 数据 量 在 不 断 地 增长 ， 开 发 合适 的 数据 
保护 措施 的 需求 也 在 不 断 增长 。 适 当 的 提供 将 数据 用 于 合法 用 途 的 许可 ， 这 也 是 很 重要 的 ， 这 
样 组 织 中 需要 这 些 数据 的 人 士 能 够 访问 它们 ， 并 相信 它们 的 质量 。 


12.10 数据 词典 与 信息 库 
RDBMS 的 一 个 不 可 分 割 的 部 分 就 是 数据 词典 〔 data dictionary )， 它 用 来 存储 元 数据 ， 即 
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关于 数据 库 的 信息 ， 包 插 该 数据 库 中 每 个 表 的 属性 名 和 定义 。 数 据 词 典 通常 是 为 每 个 数据 库 
所 生成 的 系统 目录 (system catalog ) 的 一 部 分 。 该 系统 目录 描述 所 有 的 数据 库 对 象 ， 包 括 诸 
如 表 名 、 表 创建 者 或 拥有 者 、 列 名 与 数据 类 型 、 外 键 与 主键 、 索 引文 件 、 授 权 用 户 、 用 户 访 
问 权限 之 类 的 与 表 有 关 的 数据 。 系 统 目 录 是 由 数据 库 管理 系统 创建 的 ， 并 且 信 息 存储 在 系统 
表 里 ， 这 些 系统 表 可 以 采用 像 任 何其 他 数据 表 一 样 的 方式 进行 查询 ， 只 要 用 户 拥有 相应 的 访 
问 权 限 即 可 。 

数据 词典 可 以 是 主动 型 或 者 被 动 型 的 。 主 动 型 数据 词典 是 由 数据 库 管理 软件 自动 地 进行 管 
理 的 。 主 动 型 系统 总 是 与 数据 库 的 当前 结构 和 定义 相 一 致 的 , 因为 它们 是 由 系统 本 身 来 维护 的 。 
绝 大 多 数 关系 数据 库 管 理 系 统 现在 都 包含 着 主动 型 数据 词典 ， 这 些 数据 词典 可 以 直接 从 它们 的 
系统 目录 里 派生 出 来 。 被 动 型 数据 词典 是 由 该 系统 的 用 户 ( 们 ) 管 理 的 ， 并 在 数据 库 结 构 改变 时 
加 以 修改 。 由 于 这 种 修改 必须 由 用 户 手工 完成 ， 因 此 ， 与 数据 库 的 当前 结构 相 比 ， 它 可 能 不 是 
最 新 的 。 然 而 ， 被 动 型 数据 词典 可 以 在 某 个 单独 的 数据 库 里 进行 维护 。 这 在 设计 阶段 可 能 是 很 
理想 的 ， 因 为 它 双 许 开发 者 尽 可 能 长 久 地 与 采用 特定 的 RDBMS 保 持 独立 性 。 而 且 ， 被 动 型 数 
据 词 典 可 以 不 局 限于 其 数据 库 管理 系统 所 能 够 辨别 的 信息 。 因 为 被 动 型 数据 词典 是 由 用 户 来 维 
护 的 ， 所 以 可 以 扩展 它们 以 包含 未 被 计算 机 化 的 组 织 数据 的 信息 。 
信息 库 

虽然 数据 词典 只 是 简单 的 数据 元 素 记 录 工 具 ， 然 而 。 数 据 管 理 员 和 其 他 信息 专家 可 以 用 信 
息 库 来 管理 整个 信息 处 理 环 境 。 信 息 库 (information repository) 既是 开发 环境 的 基本 组 件 ， 
也 是 生产 环境 的 基本 组 件 。 在 应 用 软件 开发 环境 中 ， 人 们 ( 既 可 以 是 信息 专家 ， 也 可 以 是 最 终 
用 户 ) 使 用 CASE 工 具 、 高 级 语言 以 及 其 他 工具 来 开发 新 的 应 用 软件 。 CASE 工 具 可 以 自动 连 
接 到 信息 库 。 在 生产 环境 中 ， 人 们 使 用 应 用 软件 来 建立 数据 库 、 保 持 数据 为 最 新 的 以 及 从 数据 
库 中 抽取 数据 。 所 有 这 些 活动 都 需要 访问 信息 库 ， 并 且 保证 信息 库 是 最 新 的 。 

如 前 所 述 ，CASE 工 具 通 常 产 生 的 信息 应 当 是 信息 库 的 一 部 分 ， 因为 它 本 身 可 作为 文档 编 
制 工 具 、 项 目 管理 工具 以 及 数据 库 管理 软件 。 当 它们 在 第 一 次 开发 时 ， 由 这 些 产品 所 记录 的 信 
息 是 不 容易 集成 起 来 的 。 然 而 ， 现 在 已 经 出 现 了 许多 使 这 些 信息 更 容易 访问 和 共享 的 尝试 。 信 
息 库 词典 系统 (Information Repository Dictionary System， IRDS ) 就 是 用 来 管理 和 控制 对 信息 
库 的 访问 的 一 种 计算 机 软件 工具 。 它 提供 了 记录 、 存 储 和 处 理 某 个 组 织 的 重要 数据 和 数据 处 理 
资源 的 工具 ( 见 Lefkovitz,1985)。 当 系统 兼容 IRDS 后 ， 就 可 以 在 由 各 种 产品 所 产生 的 数据 词典 
中 间 传 递 数据 定义 。IRDS 已 被 国际 标准 组 织 (ISO) 采纳 为 一 种 标准 (1990)， 它 包含 存储 数 
据 词 典 信息 和 访问 这 些 信息 的 一 组 规则 。 

图 12-13 显 示 了 一 种 信息 库 系统 体系 结构 的 三 个 组 件 ( 见 Bernstein,1996)。 第 一 个 组 件 是 信 
息 模 型 。 这 个 模型 是 存储 在 信息 库 里 的 信息 的 一 种 模式 ， 与 该 数据 库 相 联系 的 工具 可 以 用 该 模 
型 来 解释 信息 库 的 内 容 。 第 二 个 组 件 是 信息 库 引 擎 ， 它 管理 着 信息 库 对 象 。 其 中 包括 读 取 与 写 
和 信息 库 对 象 、 浏 览 以 及 扩展 信息 模型 等 服务 。 第 三 个 组 件 就 是 信息 库 数据 库 ， 信息 库 对 象 就 
存储 在 其 中 。 请 注意 ， 信 息 库 引擎 支持 五 种 核心 功能 ( 见 Bernstein,1996): 

“对 象 管理 ”面向 对 象 信息 库存 储 有 关 对 象 的 信息 。 随 着 数据 库 面向 对 象 程 度 的 不 断 提 高 ， 
开发 者 就 可 以 利用 在 信息 库 里 存放 的 关于 对 象 的 信息 。 信息 库 能 够 基于 一 个 面向 对 象 的 
数据 库 ， 或 者 附加 支持 对 象 的 功能 。 

“联系 管理 信息 库 引 擎 包含 着 关于 对 象 联 系 的 信息 ， 这 些 联 系 有 助 于 使 用 依附 于 该 数据 库 
的 软件 工具 。 

“动态 可 扩展 性 信息 库 信 息 模 型 定义 类 型 ， 它 应 当 很 容易 进行 扩展 ， 即 追 加 新 的 类 型 或 者 
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扩展 已 有 的 某 种 类 型 的 定义 。 这 一 功能 使 它 很 容易 将 某 个 新 的 软件 工具 集成 到 开发 过 程 

里 。 

“版 本 管理 开发 时 ， 建 立 版 本 控制 是 很 重要 的 。 信 息 库 能 够 用 来 为 软件 设计 工具 提供 版 本 
控制 功能 。 对 象 的 版 本 控制 要 比 文件 的 版 本 控制 更 加 困难 ， 因 为 在 应 用 软件 里 的 对 象 往 
往 比 文件 的 对 象 更 多 ， 而 且 一 个 对 象 的 每 个 版 本 又 可 能 有 许多 联系 。 

* 配置 管理 将 版 本 化 的 对 象 加 入 到 也 是 版 本 化 的 代表 整个 系统 的 配置 里 也 很 有 必要 。 它 可 
以 帮助 我 们 把 配置 看 作 与 文件 目录 相 类 似 的 东西 ， 只 是 配置 是 可 以 版 本 化 的 ， 而 且 它 们 
包含 的 是 对 象 而 不 是 文件 。 信 息 库 经 常用 检 出 系统 来 管理 对 象 、 版 本 和 配置 。 希 望 使 用 
某 个 对 象 的 开发 者 将 该 对 象 检 出 ， 作 出 适当 的 变更 ， 再 将 该 对 象 检 入 。 此 时 ， 创 建 了 对 
象 的 一 个 新 版 本 ， 并 且 其 他 开发 者 又 可 以 使 用 该 对 象 了 。 








信息 库 引擎: 
对 旬 联系 | 可 扩展 类 型 


| 





版 本 && 配 置 管理 

















图 12-13 信息 库 系统 体系 结构 的 三 个 组 件 (改编 自 Bernstein,1996) 


随 着 面向 对 象 数据 库 管理 系统 的 可 用 性 越 来 越 高 ， 关 系数 据 库 相 联系 的 面向 对 象 编程 的 增 
长 ， 信 息 库 的 重要 性 也 在 不 断 增长 。 因 为 面向 对 象 开发 需要 利用 包含 在 信息 库 里 的 元 数据 。 此 
外 ， 在 IRDS 标 准 已 经 被 普遍 接受 的 今天 ， 由 不 同 的 软件 工具 所 产生 的 元 数据 和 应 用 软件 信息 
可 以 很 容易 地 集成 到 信息 库 里 。 虽 然 信息 库 已 经 被 包括 在 企业 级 开发 工具 里 ， 但 由 于 对 面向 对 
象 开发 的 关注 仍然 不 断 增长 ， 这 将 会 导致 信息 库 的 用 途 更 加 广泛 。 


12.11 数据 库 性 能 调整 概述 


有 效 的 数据 库 支持 可 产生 可 靠 的 数据 库 ， 其 性 能 不 会 受到 硬件 、 软 件 或 用 户 应 用 软件 的 干 
扰 ， 并 能 达到 其 最 佳 性 能 。 调 整数 据 库 并 非 仅仅 是 在 DBMS 安 装 时 或 者 实现 某 个 新 的 应 用 软件 
时 所 做 的 一 项 工作 ， 然 后 就 听 之 任 之 。 相 反 ， 性 能 分 析 和 调整 是 所 有 数据 库 管理 持续 存在 的 一 
部 分 ， 因 为 硬件 和 软件 的 配置 在 改变 ， 而 用 户 的 活动 也 在 改变 。 当 尝试 维护 一 个 调整 良好 的 数 
据 库 时 ， 就 应 当 解 决 DBMS 管 理 的 五 个 方面 的 问题 ， 即 DBMS 的 安装 、 内 存 利 用 、 输 入 /输出 和 
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用 、CPU 利 用 以 及 应 用 软件 调整 。 数 据 库 管理 员 对 上 述 每 个 方面 影响 随 着 PBMS 产 品 的 不 同 会 
有 很 大 的 区 别 。 我 们 在 本 节 所 采用 的 DBMS 是 Oracle 8i， 不 过 应 当 指 出 ， 每 个 产品 都 具有 其 固 
有 的 调整 功能 集合 。 

调整 数据 库 应 用 软件 需要 熟悉 其 系统 环境 、DBMS 、 应 用 软件 以 及 该 软件 所 使 用 的 数据 。 
这 种 场合 正 是 检验 数据 库 管 理 员 的 功力 的 地 方 。 要 达到 一 种 安静 的 环境 ， 也 就 是 一 种 可 靠 的 、 
允许 用 户 有 把 握 及 时 得 到 所 需 信 息 的 环境 ， 所 需要 的 技术 能 力 和 经 验 ， 只 有 通过 多 年 的 数据 库 
工作 实践 方 可 获得 。 以 下 所 讨论 的 方面 都 是 十 分 一 般 的 ， 主 要 让 用 户 对 调整 数据 库 所 涉及 活动 
的 范围 有 初步 理解 ， 而 不 是 详细 介绍 调整 某 个 特定 数据 库 应 用 软件 的 细节 。 

12.11.1 安装 DBMS 

DBMS 产 品 的 正确 安装 对 于 任何 环境 来 说 都 是 必需 的 。 产 品 中 通常 都 会 包括 一 个 README 
文件 ,该 文件 中 包含 详细 的 安装 指示 、 过 程 的 修订 、 安 装 时 必须 增加 磁盘 空间 的 注意 事项 等 等 。 
快速 浏览 README 文 件 可 以 节省 安装 时 间 ， 并 产生 较 好 的 安装 效果 。 一 般 性 的 安装 指示 也 应 
当 浏览 一 下 ， 否则 有 可 能 会 在 安装 过 程 中 产生 默认 值 , 而 这 些 默认 值 未 必 是 该 用 户 的 最 佳 选择 。 

这 里 列举 一 下 革 些 可 E 的 注意 事项 。 

在 安装 开始 前 ， 数据 库 管理 员 应 当 确保 可 以 提供 充足 的 磁盘 空间 。 你 应 该 参考 特定 DBMS 
的 手册 ， 以 便 将 逻辑 数据 库 大 小 参数 (比如 字段 长 度 、 表 的 行 数 和 估计 的 增长 ) 转化 为 实际 的 
物理 空间 需求 ， 也 许 推荐 的 空间 需求 是 很 低 的 ， 但 由 于 要 对 DBMS 作 出 改变 ， 所 以 空间 应 该 大 

5， 不 过 ， 这 个 文档 不 能 反映 其 变化 。 为 了 保险 起 见 ， 一 般 至 少 要 比 所 建议 的 空间 多 分 配 
0% 在 祷 和 和 有 人 各 也 和议 的 空间 多 分 本 
注意 到 的 安装 问题 ， 或 者 提供 安装 过 程 如 预期 那样 顺利 的 保证 。 

还 需要 考虑 为 数据 库 分 配 的 磁盘 空间 。 例 如 ， 某 些 UNIX 备 份 系统 在 处 理 大 小 超过 1GB 的 
数据 文件 时 会 出 现 问题 。 保 持 数据 文件 都 小 于 1GB 就 能 避免 可 能 出 现 的 麻烦 。 按 标准 大 小 分 
配 数据 文件 ， 能 够 很 容易 平衡 WO， 因 为 数据 文件 位 置 的 交换 比较 容易 ， 这 应 当 是 化 解 瓶颈 所 
知 要 的 。 

12.11.2 内 存 利用 

内 存 的 有 效 利用 ， 涉 及 到 理解 DBMS 如 何 使 用 内 存 ， 正 在 使 用 哪些 缓冲 ， 以 及 在 内 存 中 的 
程序 有 哪些 要 求 。 例 如 ，Oracle 在 数据 库 运 行 某 个 数据 库 管理 功能 时 ， 有 许多 驻 留 在 内 存 中 的 
后 台 过 程 。 某 些 操作 系统 需要 一 段 连 续 的 内 存 块 才能 装载 Oracle， 而 内 存 不 足 的 系统 应 该 首先 
释放 内 存 空间 。Oracle 在 内 存 中 维护 一 个 数据 词典 高 速 缓冲 ， 理 想 情况 下 ， 它 的 大 小 应 该 使 得 
至 少 90% 的 数据 词典 请 求 可 以 容纳 其 中 ， 而 无 须 检索 磁盘 信息 。 这 里 的 每 种 情况 ， 都 是 在 调整 
数据 库 时 应 当 考 虑 的 典型 的 内 存 管理 问题 。 

12.11.3 输入 /输出 争 用 

达到 最 大 的 VO 性 能 是 调整 数据 库 最 重要 的 方面 之 一 。 数 据 库 应 用 软件 是 WO 密集 型 的 一 一 
生产 数据 库 在 其 工作 时 通常 会 向 磁盘 读 写 大 量 的 数据 。 尽 管 CPU 的 时 钟 速度 急剧 增长 ， 但 WO 
速度 却 没有 相应 的 增长 ， 而 且 增 加 了 复杂 性 的 分 布 式 数据 库 系 统 则 会 有 更 为 复杂 的 MO 功能 。 

理解 最 终 用 户 如 何 访问 数据 对 于 管理 IO 争 用 极其 重要 。 当 开发 热点 〈 即 反复 访问 的 物理 
磁盘 位 置 )， 理 解 引 起 热点 的 活动 的 本 质 为 数据 库 管理 员 提供 更 多 的 机 会 来 减少 MO 争 用 。 
Oracle 允 许 DBA 控 制 包含 数据 文件 的 表 空 间 的 位 置 。DBA 对 用 户 活动 的 深刻 理解 有 助 于 他 通过 
分 隔 开 同时 访问 的 数据 文件 来 减少 1JO 争 用 。 只 要 有 可 能 ， 就 应 当 将 需要 并 发 性 访问 的 大 型 数 
据 库 对 象 从 磁盘 上 刊 去 ， 以 减少 IO 争 用 ， 并 改善 性 能 。 分 布 式 IO 活动 的 总 体 目 标 均匀 地 分 布 
在 磁盘 和 驱动 控制 器 上 ， 应 当 能 指导 DBA 调 整 VO。 
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“12.11.4 CPU 利用 

绝 大 多 数 数据 库 操作 正在 趋向 于 要 求 CPU 工 作 活 动 。 因 此 ， 在 调整 数据 库 时 ， 对 CPU 利 用 
的 评估 就 很 重要 。 采 用 多 CPU ， 就 能 在 CPU 并 行 工 作 时 ， 共 享 查询 处 理 ， 而 且 性 能 也 可 以 得 到 
极 大 提高 。DBA 应 该 使 现 有 的 CPU 性 能 达到 最 大 ， 尽 管 规划 的 收益 可 以 通过 每 次 CPU 的 更 新 换 
代 来 达到 。 

监控 CPU 负载 ， 从 而 了 解 24 小 时 的 典型 负载 ， 这 可 以 向 DBA 提 供 开 始 重新 平衡 CPU 负载 所 
需 的 基本 信息 。 在 各 种 环境 下 都 应 该 重新 调整 联机 与 后 台 处 理 的 混合 。 例 如 ， 建 立 “ 凡 是 可 以 
在 工作 时 间 以 外 的 时 间 运 行 的 所 有 作业 ， 必 须 在 工作 时 间 以 外 的 时 间 里 运行 ”这 样 一 条 规则 ， 
将 有 助 于 减轻 机 器 在 高 峰 工作 时 间 的 负载 。 人 确立 带 有 有 限 空间 的 用 户 账户 ， 也 有 助 于 管理 CPU 
负载 。 

12.11.5 应 用 软件 调整 

前 面 几 节 集 中 讨论 了 调整 DBMS 的 活动 。 考 察 最 终 用 户 在 数据 库 中 使 用 的 应 用 软件 ， 也 可 
能 会 提高 性 能 。 尽 管 规范 化 至 少 要 达到 3NF 是 许多 采用 关系 数据 模型 的 组 织 所 期 待 的 ， 仔 细 计 
划 的 非 规范 化 ( 见 第 6 章 ) 仍 然 可 能 会 改善 性 能 ， 这 通常 在 运行 某 个 SQL 查询 时 ， 通 过 减少 必须 联 
结 的 表 的 数目 来 实现 。 

考察 和 修改 应 用 软件 中 的 SQL 代码 也 可 以 改善 性 能 。 例 如 ， 扫 描 整 个 表 的 查询 应 当 尽量 避 
免 ， 因 为 它们 不 是 选择 性 的 ， 也 不 可 能 长 时 间 地 驻 留 在 内 存 里 。 这 就 要 求 从 长 期 存储 器 里 进行 
更 多 的 检索 。 凡 是 在 使 用 DBMS 的 时 候 ， 应 当 对 多 表 联 结 主动 加 以 管理 ， 因 为 联结 的 类 型 可 能 
极 大 地 影响 性 能 ， 尤 其 是 需要 联结 整个 表 的 那些 联结 。 

类 似 地 ， 包 含 视图 和 包含 子 查 询 的 语句 也 应 当 加 以 审查 。 应 当 调整 这 些 语句 ， 以 最 有 效 的 
方式 分 解 这 些 组 件 ， 可 能 会 使 性 能 显著 提高 。 第 6 章 讨论 过 一 种 技术 ，DBA 可 以 用 来 调整 应 用 
软件 的 处 理 速度 和 磁盘 空间 利用 率 ( 比 如 重新 索引 、 覆 盖 自 动 查询 计划 、 改 变数 据 块 大 小 、 在 
存储 设备 上 再 分 配 文件 以 及 有 效 查询 设计 的 指南 )。DBA 在 向 程序 员 和 开发 者 推荐 最 有 效 的 技 
术 方 面 起 着 很 重要 的 作用 。 

对 数据 库 性 能 可 能 会 受到 影响 的 那些 方面 进行 简要 描述 ， 有 助 于 读者 了 解 有 效 的 数据 库 管 
理 和 调整 的 重要 性 。 当 DBA 对 由 他 负责 的 DBMS 和 应 用 软件 有 了 较 深 的 理解 后 ， 调 整数 据 库 性 
能 的 重要 性 就 变 得 很 明显 了 。 希 望 本 节 关 于 数据 库 调整 的 简要 描述 ， 能 够 激 起 读者 进一步 学 习 
更 多 的 数据 库 产品 ， 提 高 调整 的 能 力 的 欲望 。 


本 章 小 结 


本 章 重点 介绍 了 对 数据 进行 管理 的 重要 性 。 数 据 管理 负责 数据 资源 的 总 体 管理 ， 其 功能 包 
括 开发 保护 与 控制 数据 的 过 程 ， 分 解数 据 的 权 属 与 使 用 问题 以 及 开发 和 维护 全 公司 范围 的 数据 
定义 与 标准 。 另 一 方面 ， 数 据 库 管理 功能 则 与 直接 管理 一 个 或 者 多 个 数据 库 有 关 ， 包 括 DBMS 
的 安装 与 升级 、 数 据 库 的 设计 问题 与 技术 问题 ， 如 安全 性 的 强制 实施 、 数 据 库 性 能 以 及 备份 与 
恢复 等 。 在 目前 的 业务 环境 下 , 面 对 既 要 快速 建立 高 性 能 的 系统 又 要 保证 数据 质量 的 巨大 压力 ， 
数据 管理 与 数据 库 管理 的 作用 也 在 不 断 地 变化 。 达 到 这 些 期 望 的 关键 是 开发 一 个 企业 的 体系 结 
构 (ISA)， 并 制定 合适 的 数据 库 规划 。 

对 于 数据 安全 性 的 威胁 包括 偶然 的 损失 、 偷 窃 与 欺诈 、 私 密 性 受 损 、 数 据 完整 性 受 损 以 及 
可 用 性 受 损 等 。 要 解决 这 些 潜在 的 威胁 需要 一 份 全 面 的 数据 安全 性 规划 ， 可 以 通过 建立 视图 、 
授权 规则 、 用 户 自 定义 过 程 和 加 密 过 程 消除 部 分 威胁 。 

数据 库 恢复 与 备份 过 程 是 另 一 类 基本 的 数据 管理 活动 。 必 须 具 备 的 基本 恢复 工具 包括 备份 
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工具 、 日 志 记 录 工 具 、 检 查 点 工具 和 恢复 管理 器。 根据 问题 的 类 型 ， 可 能 还 需要 后 癌 恢复 ( 回 
油 址 和 该 复 而 这 ) 

多 用 户 环境 中 的 并 发 性 访问 问题 也 必须 加 以 考虑 。DBMS 必 须 确保 数据 库 事务 具有 
ACID 特性 ， 即 原子 性 (atomic )、 一 致 性 (consistent ) 、 隔 离 性 (isolated) 与 持久 性 
人 
并 发 性 控制 ， 就 有 可 能 出 现 更 新 丢失 的 情况 ， 这 将 影响 数据 完整 性 。 可 以 采用 包括 共享 锁 与 
排他 锁 在 内 的 加 锁 机 制 。 在 多 用 户 症 境 下 还 可 能 出 现 死 名 现象， 这 可 以 通过 各 种 手段 ， 包 括 
应 用 两 阶段 加 锁 协 议 或 者 其 他 的 死 锁 化 解 机 制 来 加 以 管理 。 版 本 设置 是 并 发 性 控制 的 一 种 理 
想 措施 。 

维护 高 质量 数据 涉及 五 个 方面 : 安全 性 策略 与 灾难 恢复 、 人 员 控 制 、 物 理 访问 控制 、 维 护 
控制 以 及 数据 保护 与 私密 性 。 

数据 词典 往往 是 绝 大 多 数 关系 数据 库 管 理 系统 的 系统 目录 的 一 部 分 ， 对 数据 词典 和 信息 库 
的 管理 有 助 于 DBA 维 护 高 质量 的 数据 与 高 性 能 的 数据 库 。 信 息 库 词 典 系统 IRDS) 标 准 的 建立 ， 
有 利于 开发 信息 库 的 信息 ， 这 些 信 息 集成 了 来 自 DBBMS、CASE 工 具 和 软件 开发 工具 等 多 种 来 
源 的 信息 。 

实现 高 效 的 数据 管理 是 不 容易 的 ， 有 可 能 碰 到 上 述 所 有 方面 的 问题 。 一 方面 ， 对 于 面向 对 
象 开发 方法 和 快速 开发 技术 的 日 益 重 视 ， 正 在 改变 着 数据 管理 的 功能 ; 另 一 方面 ， 实 现 有 效 管 
理 和 数据 库 调整 的 优秀 工具 的 可 用 性 也 越 来 越 高 。 


本 章 复 习 
关键 术语 
数据 管理 数据 库 管理 数据 库 安全 性 
授权 规则 用 户 自 定义 过 程 加 密 
生物 设备 数据 库 恢复 备份 工具 
日 志 记 录 工 具 事务 事务 日 志 
数据 库 变 更 日 志 前 象 后 象 
检查 点 工具 恢复 管理 器 复原 / 重 运行 
事务 边界 后 向 恢复 ( 回 滚 ) 前 向 恢复 (前 滚 ) 
中 止 事务 数据 库 崩溃 并 发 性 控制 
不 一 致 读 问题 加 锁 加 锁 级 别 (粒度 ) 
共享 锁 (S 锁 或 读 锁 ) 排他 锁 〈X 锁 或 写 锁 ) 死 锁 
死 锁 预防 两 阶段 加 锁 协 议 死 锁 化 解 
版 本 设置 数据 管家 数据 词典 
系统 目录 信息 产 信息 库 词 典 系统 (IRDS) 
复习 问题 
1 定义 以 下 术语 : 
a. 数据 管理 b. 数据 库 管 理 c. 数据 管家 
d. 信息 库 e. 加 锁 f. 版 本 设置 
g. 死 锁 h. 事务 i. 加 密 
2. 将 下 列 术 语 及 其 定义 匹配 起 来 : 


一 备份 工具 a. 保护 数据 免 遭 损坏 或 误 用 
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__ 生物 设备 b. 异常 或 者 中 止 事务 的 恢复 
检查 点 工具 c. 描 述 所 有 数据 库 对 象 
_ ”数据库 恢复 d. 自动 地 产生 整个 数据 库 的 一 个 拷贝 
_ 数据库 安全 性 e. 后 象 应 用 
粒度 f. 可 以 分 析 你 的 签名 
恢复 管理 器 g. 在 受 损 后 复原 数据 库 
_ 回 滚 h. 在 故障 后 复原 数据 库 的 DBMS 模 块 
前 深 i. 数据 库 需 要 对 事务 加 锁 的 级 别 
系统 目录 j. 同步 记录 数据 库 状 态 
3. 比较 和 对 比 下 列 术 语 : 
a. 数据 管理 ; 数据 库 管理 b. 信息 库 ; 数据 词典 
c. 死 锁 预防 ; 死 锁 化 解 d. 后 向 恢复 ; 前 向 恢复 
e. 主动 型 数据 词典 ; 被 动 型 数据 词典 f. 乐观 并 发 性 控制 ; 翡 观 并 发 性 控制 
g. 共享 锁 ; 排他 锁 h. 前 象 ; 后 象 
i 两 阶段 加 锁 协 议 ; 版 本 设置 j. 授权 ; 认证 


4. 数据 管家 的 功能 是 什么 ? 

5. 简要 描述 典型 的 数据 库 系统 生命 周期 的 六 个 阶段 。 

6. 描述 在 当前 业务 环境 下 数据 管理 员 与 数据 库 管理 员 作用 的 变化 。 

7. 列举 造成 数据 管理 低 效 的 四 个 常见 问题 。 

8. 列举 系统 数据 管理 或 数据 管理 员 所 必需 的 四 种 职业 技能 。 列 举 项 目 数据 管理 或 数据 库 管 
理 员 所 必需 的 四 种 职业 技能 。 

9. 列 出 并 描述 实现 有 效 的 数据 库 管 理 所 应 当 具备 的 11 种 功能 。 

10. 为 了 快速 交付 高 质量 、 功 能 强大 的 系统 ， 可 以 在 传统 的 数据 库 开 发 生命 周期 每 一 阶段 
的 数据 管理 中 做 哪些 改变 ? 

11. 列 出 并 讨论 可 能 会 对 数据 安全 性 构成 威胁 的 五 个 方面 。 

12. 阐述 如 何 创 建 提高 数据 安全 性 的 视图 ， 解 释 为 什么 人 们 不 应 该 完全 依靠 视图 来 强制 实 
施 数据 安全 性 。 

13. 列 出 并 简要 说 明 如 何 应 用 完整 性 控制 来 保障 数据 库 安全 性 。 

14. 认证 模式 与 授权 模式 之 间 有 什么 区 别 ? 

15. 与 悲观 并 发 性 控制 相 比 ， 乐 观 并 发 性 控制 有 哪些 好 处 ? 

16. 共享 锁 与 排他 锁 之 间 的 区 别 是 什么 ? - 

17. 死 锁 预防 与 死 锁 化 解 之 间 有 什么 区 别 ? 

18. 简要 描述 数据 库 备 份 与 恢复 所 需要 的 四 种 DBMS 工 具 。 

19. 什么 是 事务 完整 性 ? 为 什么 它 如 此 重要 ? 

20. 列 出 并 描述 数据 库 故障 的 四 种 常见 类 型 。 

21. 列 出 并 描述 为 了 获得 高 质量 数据 所 应 当 解 决 的 五 个 方面 。 

22. 什么 是 信息 库 词 典 系 统 IRDS)? 

23. 列 出 并 简要 说 明 数 据 库 事 务 的 ACID 特 性 。 

24. 阐述 加 密 的 两 种 常见 形式 。 

25. 概述 六 种 数据 库 保护 过 程 。 
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问题 和 练习 
对 仓库 管理 职员 的 授权 对 库存 记录 的 授权 




















1. 根据 下 列 假设 为 松 谷 家 具 公 司 填 写 前 面 的 两 张 表格 。 
(1) 推销 员 、 经 理 和 木工 可 以 读 取 库 存 记录 ， 但 不 能 对 这 些 记录 执行 其 他 操作 。 
(2) 会 计 出 纳 可 以 读 取 或 更 新 (插入 、 修 改 、 删 除 ) 应 收 款 记录 和 顾客 记录 。 
(3) 仓库 管理 职员 可 以 读 取 或 更 新 (修改 、 删 除 ) 库存 记录 。 他 们 不 可 以 查看 应 收 款 记 
录 或 工资 单 。 他 们 可 以 读 取 但 不 能 修改 顾客 记录 (输入 Y 代 表 yes ，N 代 表 no)。 
2. 以 下 列 出 五 种 恢复 技术 ， 针 对 下 列 的 每 种 情形 ， 确 定 最 适宜 使 用 哪 种 恢复 技术 。 


(1) 后 向 恢复 (2) 前 向 恢复 (从 最 近 检 查 点 ) 
(3) 前 向 恢复 (采用 数据 库 备份 拷贝 ) (4) 重新 处 理事 务 
(5) 切换 


a. 当 用 户 正在 进入 某 个 事务 时 ， 出 现 了 一 次 电话 断 线 。 
b. 在 正常 操作 时 ， 出 现 某 个 磁盘 驱动 器 故障 。 
c. 由 于 突然 的 暴风 雨 引 起 的 电源 故障 。 
d. 学 生 学 费 金 额 输入 不 正确 ， 并 且 已 经 显示 出 来 。 该 错误 在 几 个 星期 内 都 没有 发 现 。 
e. 当 数 据 库 崩 溃 时 ， 数 据 录 入 员 已 经 在 进行 完全 的 数据 库 备 份 之 后 又 用 两 个 小 时 输入 事 
务 。 这 时 发 现 自从 备份 以 后 ， 数 据 库 的 日 志 记 录 工 具 根本 没有 工作 。 
3. Whitlock 百 货 店 在 局 域 网 文件 服务 器 上 运行 多 用 户 的 DBMS。 但 是 ， 该 DBMS 现 在 还 不 
能 实现 并 发 性 控制 。Whitlock 的 某 个 顾客 账户 有 一 笔 $250.00 的 欠 账 应 付 ， 此 时 有 三 笔 与 该 顾客 
有 关 的 事务 要 同时 处 理 : 
(1) 支付 $250.00 (2) 内 购 $100.00 (3) 退货 (信用 )$50.00 
这 三 笔 事务 都 要 在 账户 余额 为 $250.00 时 ( 即 在 其 他 事务 完成 之 前 ) 读 取 该 客户 的 记录 。 
更 新 后 的 顾客 记录 以 上 述 顺 序 返 回 数据 库 。 回 答 以 下 间 题 : | 
(1) 在 最 后 一 笔 事务 完成 之 后 ， 该 顾客 的 账户 将 会 有 多 少 余额 ? 
(2) 在 这 三 笔 事务 完成 之 后 ， 该 顾客 的 账户 应 该 有 多 少 余额 ? 
4. 针对 下 面 描 述 的 每 种 情况 ， 指 出 最 适合 使 用 下 述 哪 种 安全 性 措施 : 
(1) 授权 规则 (2) 加 密 (3) 认证 模式 
a. 一 家 全 国 性 的 经 纪 公司 采用 电子 资金 转账 (EFT) 系 统 在 各 地 传输 敏感 的 财务 数据 。 
b. 某 个 组 织 正在 建设 一 座 基 于 计算 机 的 培训 中 心 离散 站 点 。 该 组 织 希望 只 有 授权 的 员 
工 能 够 访问 该 站 点 。 由 于 每 个 员工 并 非 经 常 使 用 该 中 心 ， 所 以 不 希望 为 员工 配备 中 
的 钥匙 。 
c. 某 个 制造 企业 采用 简单 的 口令 系统 来 保护 其 数据 库 ， 但 后 来 发 现 需要 一 个 更 加 全 面 的 
系统 来 为 不 同 的 用 户 授予 不 同 的 权限 (如 读 取 但 不 能 创建 或 更 新 )。 
4. 一 所 大 学 发 现 有 大 量 非 授权 用 户 利用 从 合法 用 户 那里 窃取 的 口令 访问 各 种 文件 和 数据 
库 ， 这 让 管理 人 员 很 头痛 。 
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5. Metro Marketers 公 司 打算 建造 一 个 数据 仓库 ， 用 来 存储 顾客 信息 以 进行 市 场 分 析 。 所 建 
造 的 数据 仓库 要 比 他 们 了 原先 所 要 求 的 容量 更 大 、 处 理 能 力 更 强 ， 因 此 他 们 考虑 分 别 以 Oracle 和 
Red Brick 作 为 其 数据 库 和 数据 仓库 产品 。 作 为 实施 计划 的 一 部 分 ，Metro 公 司 开始 配置 数据 管 
理 职能 。 目 前 ， 数 据 管理 员 这 个 职位 有 四 位 候选 人 : 

a. Monica Lopez, 拥 有 五 年 Oracle 数 据 库 管理 经 验 的 高 级 数据 库 管 理 员 ， 曾 为 一 家 国际 银 
行 管理 过 财务 数据 库 ， 但 没有 任何 数据 仓库 方面 的 经 验 。 

b. Gerald Bruester, 拥 有 六 年 Informix 数 据 库 管理 经 验 的 高 级 数据 库 管 理 员 ， 曾 为 一 家 在 
《财富 》 杂 志 上 排名 前 1000 名 的 食品 生产 企业 管理 过 面向 市 场 的 数据 库 。Gerald 在 去 
年 12 个 月 里 参加 了 多 个 数据 仓库 研讨 班 ， 对 数据 仓库 有 着 浓厚 的 兴趣 。 

c. Jim Reedy， 目 前 是 Metro Marketers 的 项 目 经 理 。Jim 非 常熟 悉 Metro 现 行 的 系统 环境 ， 
并 获得 其 同事 的 好 感 。 他 参与 过 Metro 当 前 的 数据 库 系 统 的 建设 ,但 还 没有 任何 数据 
仓库 方面 的 经 验 。 

d. Marie Weber， 拥 有 两 年 经 验 的 数据 仓库 管理 员 ， 曾 经 利用 基于 Red Brick 的 应 用 软件 
为 一 家 汽车 保险 公司 跟踪 过 事故 信息 。 

基于 上 述 信息 ， 对 这 四 位 数据 管理 员 职 位 候选 人 进行 排序 ， 并 陈述 排序 的 理由 。 

6. 参照 问题 和 练习 5， 对 这 四 位 数据 仓库 管理 员 职 位 候选 人 进行 排序 ， 并 陈述 排序 的 理由 。 

7. 参照 问题 和 练习 5， 对 这 四 位 数据 库 管理 员 职 位 候选 人 进行 排序 ， 并 陈述 排序 的 理由 。 

8. 倘若 你 应 聘 某 个 数据 库 管理 员 的 工作 ， 间 时 发 现 数 据 库 用 户 在 每 天 早晨 上 班 时 采用 一 个 
公共 的 口令 进入 数据 库 ， 你 会 作 何 考虑 ?你 又 得 知 他 们 其 至 在 离开 机 器 时 仍然 让 工作 站 整 天 连 
接 到 工作 站 上 ， 你 又 作 何 考虑 ? 

9. 某 个 组 织 拥 有 一 个 带 三 台 磁 盘 设 备 的 数据 库 服 务 器 ， 会 计 和 工资 软件 共享 其 中 的 一 个 磁 
堆 设 备 ， 但 总 是 发 现 有 性 能 的 问题 。 请 你 来 研究 这 个 问题 并 调整 数据 库 。 在 减少 WO 和 争 用 方面 ， 
你 会 提出 什么 建议 ? 

10. 假设 你 在 某 个 拥有 遍布 全 球 的 分 布 式 数据 库 的 组 织 里 担任 数据 库 管 理 员 。 你 分 析 了 数 
据 库 的 性 能 ， 在 分 析 中 你 发 现 ， 所 有 的 区 域 性 月 销售 报表 都 是 在 该 公司 总 部 完成 的 。 公 司 运 营 
分 成 五 个 区 域 : 美国 东部 、 美 国 西部 、 加 拿 大 、 南 美洲 和 墨西哥 。 在 每 个 区 域 总 部 的 服务 器 里 
都 保存 着 各 自 区 域 的 全 部 数据 。 你 会 如 何 改善 制作 月 销售 报表 所 需 的 时 间 ? 

11. 当 你 阅读 本 书 时 ， 假 设 某 个 流行 的 DBMS (如 微软 的 Access) 发 行 了 新 的 版 本 ， 你 要 
从 某 一 旧版 本 升级 安装 该 产品 。 此 时 你 会 面 对 什 么 样 的 问题 ?你 是 否 需要 转换 数据 库 ? 为 什 
么 ? 假设 数据 库 已 经 进行 过 转换 ， 它 是 比 前 一 版 本 的 数据 库 占用 的 空间 更 多 还 是 更 少 ? 这 又 是 
为 什么 ? 为 前 一 版 本 编写 的 查询 和 程序 现在 是 否 仍然 能 够 工作 ? 为 什么 ? 能 否 在 同一 台 计 算 机 
上 同时 运行 两 种 版 本 ? 为什么? 

12. 回顾 第 6 章 问 题 和 练习 5 的 答案 ， 是 否 有 机 会 为 该 数据 库 创 建 某 个 域 ? 如 果 可 以 ， 请 描 
述 这 个 域 。 此 外 ， 是 否 有 可 能 为 控制 这 个 数据 库 的 完整 性 定义 一 个 断言 ? 

13.. 回 顾 第 6 章 问题 和 练习 5 的 答案 。 

a. 概述 为 现 有 的 顾客 补 发 一 张 新 卡 这 一 业务 事务 的 步骤 。 试 为 一 个 或 多 个 需要 创建 
ACID 事 务 的 数据 库 事 务 定义 边界 ， 并 检验 答案 的 正确 性 。 
b. 概述 为 新 顾客 发 一 张 新 卡 这 一 业务 事务 的 步骤 。 试 为 一 个 或 多 个 需要 创建 ACID 事务 
的 数据 库 事务 定义 边界 ， 并 检验 答案 的 正确 性 。 
应 用 练习 
1. 参观 某 个 已 经 实施 数据 库 方 法 的 组 织 ， 并 评估 如 下 几 个 方面 : 
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a. 系统 数据 管理 与 项 目 数据 管理 在 该 组 织 中 的 设置 。 

b. 系统 数据 管理 与 项 目 数据 管理 的 职责 分 配 。 

c. 数据 管理 负责 人 的 背景 与 经 验 。 

d. 信息 库 的 状态 与 利用 (被 动 型 、 主 动 型 设计 或 者 主动 型 运作 )。 

2. 参观 某 个 已 经 实施 数据 库 方法 的 组 织 ， 并 与 接触 过 灾难 恢复 计划 的 MIS 部 门 员工 面谈 ， 

了 解 该 组 织 的 灾难 恢复 计划 。 在 面 痰 前 ， 先 仔细 考虑 该 组 织 会 遇 到 各 种 灾难 的 相对 可 能 性 。 例 
如 ， 该 地 区 是 否 会 有 地 震 或 其 他 自然 灾难 ? 厂房 有 可 能 受到 何 种 破坏 ? 使 用 这 个 系统 的 员工 具 
有 怎样 的 背景 、 接 受过 何 种 培训 ? 找 出 该 组 织 的 灾难 恢复 计划 ， 并 特别 询问 你 所 能 想到 的 各 种 


带 在 的 问题 。 
3. 参观 某 个 已 经 实施 数据 库 方法 的 组 织 ， 通 过 面谈 了 解 他 们 平时 所 采取 的 安全 性 措施 。 对 
如 下 方面 进行 评估 : 
a. 数据 库 安全 性 措施 b. 网 络 安全 性 措施 c. 操作 系统 安全 性 措施 
d. 厂房 安全 性 措施 e. 个 人 安全 性 措施 


4. 确定 某 个 处 理 大 量 零星 突 发 性 数据 负载 的 组 织 。 例 如 ， 已 实施 数据 仓库 的 组 织 ， 因 为 它 
既然 使 用 数据 仓库 ， 就 可 能 会 有 较 大 的 数据 负载 。 试 确定 该 组 织 在 其 容量 规划 中 是 采用 什么 措 
施 来 处 理 这 样 大 量 的 数据 负载 的 ? 

5. 随 着 时 间 推 移 ， 数 据 库 一 般 总 是 越 来 越 大 ， 因 为 新 的 事务 数据 不 断 增加 。 请 至 少 与 三 家 
数据 库 不 断 增 大 的 公司 面谈 ， 并 确定 他 们 决定 清除 或 者 归档 旧 数 据 的 准则 与 过 程 。 确 定 它们 隔 
多 入 清除 数据 ， 清 除 的 又 是 哪些 类 型 数据 ? 同时 找 出 每 个 组 织 归档 的 数据 ， 这 些 数据 又 保留 多 
长 时 间 ? 

6. 访问 http://tpc.org 网 站 。 选 择 一 篇 与 本 章 内 容 有 关 的 技术 论文 ， 并 概述 至 少 涉及 本 章 的 
一 个 主题 的 新 思想 ， 将 其 写成 一 篇 报告 。 
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。 http://developer.netscape.com/docs/manuals/security/pkin/contents.htm ”该 站 点 有 各 种 现代 
加 密 方法 的 详尽 说 明 ， 除 包括 本 章 讨论 过 的 方法 外 ， 还 有 许多 其 他 的 方法 。 
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”http:Wtpc.org ”创办 非 司 利 组 织 TPC 的 宗旨 是 制定 事务 处 理 与 数据 库 基准 ， 并 向 业界 传播 
客观 、 可 验证 的 TPC 性 能 数据 。 这 是 一 个 优秀 的 站 点 ， 通 过 阅读 数据 库 基 准 的 技术 论文 ， 
可 以 学 到 许多 与 评估 的 DBMS 和 数据 库 设 计 有 关 的 知识 。 
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项 目 案例 : 山 景 社区 医院 


在 第 2 章 结尾 ， 我 们 已 经 看 到 出 景 社区 医院 特别 研究 小 组 正在 开发 一 个 长 期 的 业务 规划 。 
这 个 小 组 的 成 员 有 Heller 先 生 、Lopez 先 生 、Jefferson 博 士 及 一 个 顾问 。 他 们 尝试 确定 一 个 规 
划 ， 以 实现 医院 的 提供 高 质量 医疗 、 成 本 控制 和 加 入 诸如 Browne 博 士 的 预防 衰老 医学 部 等 新 
型 服务 。 

信息 系统 主管 Heller 先 生 经 常 阅读 《Computerworld》、《Health Management Technology》、 
《Healthcare Information》 等 期 刊 、 杂 志 。 通 过 阅读 ， 他 了 解 到 在 大 城市 的 大 型 医院 里 实现 基于 
计算 机 的 病人 记录 (CPR) 系 统 这 一 趋势 ， 并 且 想 要 知道 山 景 社区 医院 是 否 现在 就 应 当 规 划 以 便 
未 来 实现 CPR。 通 过 阅读 ， 他 归纳 出 关于 CPR 存 在 两 种 看 法 。 直 到 最 近 ，CPR 被 当成 替代 现 有 
的 病历 记录 的 手工 系统 的 手段 ， 只 不 过 术语 的 用 法 改变 了 。 现 在 有 许多 论文 把 CPR 看 成 是 一 个 
集成 的 病人 医疗 信息 系统 ， 该 系统 可 以 由 医院 管理 员 、 医 生 、 护 理 师 和 医疗 管理 组 织 访问 。 
CPR 系 统 可 以 很 好 地 集成 来 自 病 床 终端 、 实 验 室 系统 和 管理 性 系统 等 不 同系 统 的 医疗 信息 。 集 
成 性 和 可 访问 性 达到 如 此 程度 的 系统 不 可 能 在 几 年 内 面世 。 

这 类 系统 在 收集 和 利用 医疗 信息 的 方法 上 会 有 显著 的 改变 。 正 在 建立 的 CPR 将 向 医生 提供 
-个 基础 结构 ， 使 他 能 够 访问 其 病人 的 所 有 医疗 记录 ， 其 至 是 分 布 在 各 种 医生 、 医 院 、 实 验 室 
等 许多 位 置 的 记录 以 及 保险 记录 。 最 后 ， 倘 若 CPR 成 功 集成 的 话 ， 连 病人 日 常生 活 中 的 一 些 健 
康信 息 岂 可 以 加 以 利用 。 

项 目 分 析 

1) CPR 是 否 可 以 帮助 山 景 社区 医院 达到 其 高 质量 医疗 和 成 本 控制 的 目标 ”举例 说 明 其 理由 。 

2) 确立 病历 的 安全 性 始终 是 医疗 记录 的 主要 需求 。 一 旦 决定 CPR 系 统 可 以 由 社区 医生 、 实 
仿 室 、 医 疗 组 织 访问 ， 山 景 社区 医院 会 遇 到 哪些 数据 安全 性 问题 ? 

3) 美国 医疗 消费 中 70% 以 上 是 用 于 临床 诊断 。CPR 以 什么 方式 帮助 临床 诊断 ， 从 而 帮助 控 
制 医 疗 消费 ? 

4) 如 果 CPR 系 统 在 几 年 内 不 能 广泛 使 用 ，Heller 先 生 是 否 现 在 就 要 致力 于 规划 这 类 系统 ? 
为 什么 ? 

5) 集成 的 CPR 是 否 是 适合 山 景 社区 医院 采用 ， 或 者 它 更 适合 于 更 大 型 的 社区 和 更 大 型 的 医 
院 ?在 山 景 社区 医院 中 采用 CPR 系 统 之 前 ， 是 否 要 达到 某 种 环境 要 求 ” 例 如 ， 是 否 医院 的 医生 
都 要 间 意 安装 CPR? 

项 目 练习 

1) 倘若 在 山 景 社区 医院 安装 一 个 CPR， 试 列举 需要 授权 使 用 该 系统 的 所 有 可 能 的 用 户 。 包 
括 医院 外 希望 包含 在 集成 CPR 系 统 里 的 用 户 团体 。 

2) 对 于 上 列 用 户 ， 试 指出 他 们 所 能 具备 的 权限 ( 读 取 、 插 入 、 删 除 、 修 改 )， 

3) 这 时 Heller 先 生 开始 着 手 计 划 本 章 所 描述 的 典型 数据 管理 任务 。 简 要 概述 你 认为 他 应 当 
考虑 的 问题 。 

4) CPR 系 统 并 没有 回答 诸如 数据 所 有 权 、 认 证 和 资格 性 之 类 的 法 律 问题 。 如 果 医 院 决定 实 
现 CPR 系 统 ， 那 么 为 了 处 理 这些 问 题 ， 他 们 应 当 采 取 哪 些 步 又 ? 如 果 这 些 问题 没有 解决 ， 是 否 
仍然 有 办 法 实现 CPR? 这 些 问 题 中 是 否 有 哪个 问题 不 如 其 他 问题 重要 ?为 什么 ? 
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13.1 学 习 目 标 


学 完 本 章 后 ， 读 者 应 该 具备 以 下 能 力 : 

“定义 下 列 关 键 术 语 : 分 布 式 数据 库 、 分 散 型 数据 库 、 位 置 透 明 性 、 本 地 自治 、 同 步 分 布 
式 数 据 库 、 异 步 分 布 式 数 据 库 、 本 地 事务 、 全 局 事务 、 复 制 透明 性 、 事 务 管理 器 、 故 障 
透明 性 、 提 交 协 议 、 两 阶段 提交 、 并 发 透明 性 、 盖 时 间 惟 和 半 联 结 。 

* 曾 述 在 企业 中 作为 应 用 分 布 式 数据 库 的 驱动 力 的 业务 条 件 。 

“描述 分 布 式 数 据 库 环境 多 样 化 的 优点 。 

“ 谓 述 分 布 式 数据 库 的 好 处 与 风险 。 

“ 阐述 分 布 式 数据 库 设 计 的 四 种 策略 ， 每 种 策略 中 的 可 选项 以 及 选择 策略 时 应 考虑 的 因素 。 
* 说明 作 为 分 布 式 数 据 库 设计 的 三 种 主要 手段 的 同步 数据 复制 、 异 步 数据 复制 和 数据 分 区 
的 好 处 。 

“概述 在 分 布 式 数据 库 中 处 理 查询 所 涉及 的 步骤 ， 以 及 优化 分 布 式 查询 处 理 常 用 的 儿 种 


手段 。 
“ 痢 述 几 种 分 布 式 数据 库 管理 系统 的 优点 。 
13.2 引言 


若 组 织 在 地 理 上 分 布 于 不 同位 置 ， 它 可 以 选择 将 数据 库存 放 在 某 个 中 央 计 算 机 里 ， 或 是 将 
其 分 布 于 各 个 本 地 计算 机 上 (或 者 两 者 的 组 合 )。 分 布 式 数据 库 (distributed database) 就 是 物 
理 上 虽然 分 布 在 多 个 地 点 的 计算 机 内 ， 但 通过 数据 通信 链 连接 起 来 的 逻辑 数据 库 。 我 们 强调 的 
是 ， 分 布 式 数据 库 确实 是 一 个 数据 库 ， 而 不 是 松散 的 文件 集合 。 分 布 式 数据 库 仍然 作为 一 种 企 
业 资源 进行 集中 式 管理 ， 只 不 过 提供 局 部 灵活 性 和 定制 方案 。 网 络 必须 允许 用 户 共享 数据 。 因 
此 ， 在 A 地 的 用 户 (或 程序 ) 必须 能 够 访问 (或 者 更 新 ) 放 在 B 地 的 数据 。 一 个 分 布 式 系统 的 
站 点 可 能 遍布 于 某 个 很 大 区 域 (比如 美国 或 全 世界 ) ， 也 可 能 仅 分 布 在 一 个 很 小 的 区 域 中 ( 比 
如 一 栋 大 楼 或 一 所 校园 )。 计 算 机 也 可 以 是 从 微型 机 到 大 型 机 甚至 超级 计算 机 的 各 种 计算 机 。 

分 布 式 数据 库 需 要 有 多 个 数据 库 管 理 系统 ， 每 个 远程 站 点 运行 一 个 。 不 同 的 分 布 式 数据 库 
环境 的 区 别 就 在 于 ， 这 些 不 同 的 DBMS 合 作 工 作 的 程度 ， 以 及 是 否 存在 某 个 主 站 点 来 协调 涉及 
多 个 站 点 数据 的 请 求 。 

重要 的 是 把 分 布 式 数据 库 与 分 散 型 数据 库 区 别 开 来 。 一 个 分 散 型 数据 库 (decentralized 
database ) 也 是 存放 在 多 个 位 置 的 计算 机 上 的 。 然 而 ， 这 些 计算 机 并 没有 通过 网 络 彼此 互 连 ， 
也 没有 数据 库 软 件 使 得 数据 仿佛 是 处 在 一 个 逻辑 数据 库 里 。 因 此 ， 各 个 站 点 上 的 用 户 不 能 共享 
数据 。 最 好 将 分 散 型 数据 库 看 成 是 许多 独立 数据 库 的 汇总 ， 而 不 是 地 理 上 分 布 的 单一 数据 库 。 

各 种 业务 条 件 都 鼓励 采用 分 布 式 数据 库 : 

“业务 单位 的 分 布 与 自治 现代 组 织 机 构 的 分 公司 、 部 门 与 设施 通常 都 是 地 理 上 分 散 (甚至 

跨国 ) 分 布 的 。 一 般 每 个 单位 都 有 权 创建 白 己 的 信息 系统 ， 而 且 每 个 单位 都 需要 可 以 对 之 

进行 控制 的 本 地 数据 。 商 业 并 购 经 常会 产生 这 样 的 环境 。 
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。 数 据 共享 即使 不 太 复杂 的 业务 决策 都 会 要 求 共享 各 业务 单位 上 的 数据 ， 因 此 ， 必 须 能 很 

方便 地 根据 需要 合并 各 本 地 数据 库 上 的 数据 。 

* 数据 通信 成 本 与 可 靠 性 通过 某 个 通信 网 络 传输 大 量 的 数据 或 者 从 远程 数据 源 处 理 大 量 的 

事务 ， 其 成 本 是 很 高 的 。 通 常 ， 比 较 经 济 的 做 法 是 ， 尽 可 能 将 所 需要 的 数据 和 应 用 软件 

本 地 化 。 此 外 ， 依 赖 通信 网 络 会 存在 一 定 的 风险 ， 因 此 ， 在 本 地 保存 数据 的 拷贝 或 片段 

是 实现 快速 访问 该 组 织 数据 的 一 种 可 靠 方法 。 

"多 应 用 软件 供 贷 高 环境 今天 有 许多 组 织 从 不 同 的 供 货 商 处 采购 成 套 的 应 用 软件 。 每 个 “最 

佳 解决 方案 ”软件 包 都 是 专门 为 其 固有 的 数据 库 而 设计 的 ， 并 可 能 与 不 同 的 数据 库 管 理 系 

统一 起 工作 。 人 们 可 以 定义 一 个 分 布 式 数据 库 ， 它 提供 的 功能 远 远 超出 单独 的 应 用 软件 。 

* 数据 库 恢 复 将 数据 复制 到 单独 的 计算 机 上 是 使 受 损 数据 库 迅速 复原 ， 并 使 用 户 在 主 站 点 

inal 一 种 比较 保险 的 策略 。 而 将 数据 复制 到 多 个 计算 机 站 点 正 

分 布 式 数据 库 的 一 种 自然 形式 。 

. 消 意 的 事务 与 分 析 处 理 正如 第 11 章 所 介绍 的 ， 数 据 库 管理 的 需求 随 着 OLTP 和 OLAP 应 

用 软件 的 不 同 而 有 所 区 别 。 即 使 支持 每 种 类 型 应 用 软件 的 两 个 数据 库 的 数据 相同 也 是 如 

此 。 分 布 式 数据 库 技 术 有 助 于 跨 OLTP、OLAP 平 台 实 现 数据 的 同步 。 

创建 分 布 式 数 据 库 的 功能 ， 至 少 从 20 世 纪 80 年 代 开始 就 已 具备 。 正 如 所 期 待 的 ， 存 在 各 种 
分 布 式 数据 库 备 选 方案 ( 见 Bell 和 Grimson,1992)。 图 13-1 概 括 了 分 布 式 数据 库 环境 的 范围 。 这 些 
环境 简要 并 述 如 下 





分 布 式 数据 库 坏 境 









问 构 的 妾 构 的 
自治 的 非 自治 的 系统 网 关 
完全 DBMS 功 能 部 分 多 数据 库 
联邦 型 的 非 联 邦 型 的 


紧密 集成 松散 集成 
图 13-1 分 布 式 数据 库 环境 (摘自 Bel 和 Grimson, 1992) 
I 同 构 的 每 个 结 点 采用 相同 的 DBMS 。 
A 自治 的 每 个 DBMS 独 立 工作 ， 来 回 传递 消息 ， 以 共享 数据 更 新 。 
B 非 自治 的 某 个 中 央 或 主 DBMS 协 调 数据 库 在 结 点 上 的 访问 和 更 新 。 
II 措 构 的 每 个 结 点 可 以 采用 不 同 的 DBMS 。 
A 系统 支持 一 个 逻辑 数据 库 的 某 些 或 全 部 功能 。 
i 完全 DBMS 功 能 正如 本 章 后 面 将 要 讨论 的 ， 支 持 分 布 式 数据 库 的 全 部 功能 。 
ii 部 分 多 数据 库 正如 本 章 后 面 将 要 讨论 的 ， 支 持 分 布 式 数据 库 的 一 一 部 分 功能 。 
“联邦 型 的 对 于 惟一 的 数据 请 求 ， 支 持 本 地 数据 库 。 
松散 全 成 ”对 于 每 个 本 地 数据 库存 在 多 种 模式 ， 而 每 个 本 地 DBMS 必 须 与 所 有 的 
本 地 模式 通信 。 
“紧密 全 成 存在 一 种 全 局 模式 ， 该 模式 定义 了 所 有 本 地 数据 库 上 的 所 有 数据 。 
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b 非 联邦 型 的 要 求 所 有 的 访问 都 需 通 过 某 个 中 央 的 协调 模块 。 

B 网 关 创建 通 向 其 他 数据 库 的 简单 路 径 ， 但 没有 单一 逻辑 数据 库 的 优势 。 

图 13-2 描 绘 了 一 个 同 构 分 布 式 数据 库 环 境 。 这 个 环境 可 以 通过 下 列 特征 (与 上 述 的 非 自 治 
范畴 相关 ) 加 以 定义 : 

“数据 分 布 在 所 有 的 结 点 上 。 
。 每 个 位 置 使 用 相同 的 DBMS 。 
。 所 有 的 数据 都 由 该 分 布 式 DBMS 管 理 (因此 不 存在 任何 专门 的 本 地 数据 )。 
。 所 有 用 户 都 通过 一 个 全 局 模式 或 数据 库 定义 来 访问 数据 库 。 
。 该 全 局 模式 是 所 有 本 地 的 数据 库 模 式 的 合并 。 
绝 大 多 数组 织 机 构 都 很 难 强 制 实施 某 个 同 构 环 境 ， 而 异 构 环境 更 加 难以 管理 。 


全 局 用 户 全 局 用 户 








图 13-2 同 构 分 布 式 数据 库 环 境 (摘自 Bell 和 Grimson,1992) 


正如 以 上 所 列 出 的 那样 ， 异 构 分 布 式 数据 库 环 境 存在 很 多 变 体 。 然 而 ， 在 本 章 的 后 面 ， 将 
采用 下 列 特征 定义 异 构 分 布 式 数据 库 环境 (如 图 13-3 所 示 ): 

。 数 据 分 布 在 所 有 的 结 点 上 。 

。 每 个 结 点 都 可 以 使 用 不 同 的 DBMS 。 

。 某 些 用 户 只 要 求 对 数据 库 进 行 本 地 访问 ， 这 可 以 只 采用 本 地 的 DBMS 和 模式 实现 。 

。 存 在 一 种 全 局 模式 ， 它 允许 本 地 用 户 访问 远程 数据 。 
目标 与 权衡 

分 布 式 数据 库 的 一 个 主要 目标 就 是 使 用 户 在 不 同 的 位 置 可 以 很 容易 地 访问 数据 。 为 了 达到 
这 一 目标 ， 分 布 式 数据 库 系 统 必 须 提供 所 谓 的 位 置 透明 性 (location transparency)， 也 就 是 说 ， 
用 户 (或 用 户 程 序 ) 为 了 查询 或 更 新 而 使 用 数据 时 ， 无 须知 道 数 据 的 位 置 。 来 自任 何 站 点 的 检 
索 或 更 新 数据 的 所 有 请 求 ， 都 会 由 系统 自动 地 转发 到 与 处 理 该 请 求 有 关 的 站 点 。 理 想 情 况 下 ， 
用 户 不 必 担 心 数据 的 分 布 性 ， 网 络 里 的 所 有 数据 就 仿佛 处 于 一 个 站 点 上 的 单一 逻辑 数据 库 中 。 
在 这 种 理想 情况 下 ， 只 用 一 个 查询 就 可 以 将 处 在 多 个 站 点 的 表 里 的 数据 联结 起 来 ， 就 像 数 据 都 
在 一 个 站 点 里 一 样 。 

分 布 式 数据 库 的 第 二 个 目标 是 本 地 自治 (local autonomy )， 也 就 是 在 与 其 他 结 点 连接 失败 
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时 ， 独 立 管理 和 操作 本 地 数据 库 的 能 力 ( 见 Date，1995 )。 利 用 本 地 自治 ， 每 个 站 点 都 有 能 力 
控制 本 地 数据 、 管 理 安全 性 、 记 录 事 务 并 在 出 现 本 地 故障 时 进行 恢复 ， 还 能 在 任何 中 央 或 协调 
站 点 无 法 正常 运行 时 ， 由 本 地 用 户 对 本 地 用 户 进行 全 面 访问 。 此 时 ,数据 是 本 地 持 有 和 管理 的 ， 
其 至 能 从 远程 站 点 访问 这 些 数 据 。 这 意味 着 不 需要 依靠 中 央 站 点 。 

全 局 用 户 本地 用 户 





本 地 用 户 





分 布 式 
DBMS 




















图 13-3 异 构 分 布 式 数据 库 环 境 (摘自 Bell 和 Grimson，1992) 

设计 分 布 式 数据 库 环 境 时 需要 作出 的 一 个 重要 权衡 是 ， 到 底 使 用 同步 分 布 式 技术 还 是 异步 
分 布 式 技术 ?采用 同步 分 布 式 数据 库 (synchronous distributed database ) 技术 ， 网 络 上 的 所 有 
数据 一 直 保 持 为 最 新 的 数据 ， 这 样 任何 站 点 上 的 用 户 在 任何 时 候 都 能 够 访问 网 络 上 任何 位 置 的 
数据 ， 并 总 是 得 出 相同 的 结果 。 采 用 同步 技术 ， 如 果 某 个 数据 项 的 任何 拷贝 在 网 络 的 某 个 地 方 
被 更 新 ， 则 同样 的 更 新 会 立即 应 用 到 其 他 拷贝 上 ， 或 者 被 中 止 。 同 步 技术 确保 了 数据 完整 性 ， 
并 使 得 获得 数据 最 新 拷贝 的 存放 地 点 的 复杂 性 降 到 最 低 。 同步 技术 的 响应 时 间 可 能 不 尽 如 和 人意 ， 

因为 分 布 式 DBMS 要 花费 相当 多 时 间 来 检查 更 新 是 否 正确 而 完全 地 在 网 络 上 进行 传播 。 
异步 分 布 式 数据 库 (asynchronous distributed database ) 技术 在 其 他 的 结 点 里 保存 复制 数据 
的 拷贝 ， 这 样本 地 服务 器 无 须 通 过 网 络 就 能 访问 数据 。 采 用 异步 技术 时 ， 在 远程 数据 库 上 传播 
数据 更 新 时 通常 会 有 一 定 的 延迟 ， 因 此 ， 有 一 定 程度 的 暂时 不 一 致 性 是 容许 的 。 异 步 技术 具有 
可 以 接受 的 响应 时 间 ， 因 为 更 新 在 本 地 发 生 ， 而 数据 拷贝 是 成 批 地 或 者 以 事先 预定 的 间隔 进行 
同步 的 ， 但 要 确保 结 点 上 的 数据 完整 性 和 一 致 性 处 于 正确 的 水 平 ， 其 计划 和 设计 是 比较 复杂 的 。 

与 中 央 数 据 库 相 比 ， 两 种 分 布 式 数据 库 都 有 许多 优势 。 最 重要 的 优势 有 以 下 一 些 : 
。 提 高 可 靠 性 和 可 用 性 当 集 中 式 系统 发 生 故 障 时 ， 数 据 库 就 不 能 供 所 有 用 户 使 用 。 然 而 ， 
一 个 分 布 式 系统 即使 在 某 个 部 件 失效 时 ， 都 将 会 以 稍 低 一 些 的 水 平 继续 提供 其 功能 。 可 

靠 性 与 可 用 性 取决 于 数据 是 如 何 分 布 的 。( 这 将 在 下 一 节 讨 论 。) 
。 本 地 控制 ”将 数据 进行 分 布 有 利于 本 地 的 工作 小 组 对 “它们 的 ”数据 有 更 多 的 控制 权力 ， 
这 促进 了 对 数据 完整 性 和 管理 的 改进 。 同 时 ， 用 户 在 必要 时 能 够 访问 非 本 地 的 数据 。 可 
以 为 本 地 站 点 选择 硬件 ， 使 它 与 本 地 而 不 是 全 局 的 数据 处 理工 作 匹 配 。 

“模块 性 增长 假设 组 织 扩展 到 某 个 新 的 地 区 或 者 增加 了 某 个 新 的 工作 机 构 ， 那 么 向 其 分 布 
式 网 络 增加 一 个 本 地 计算 机 以 及 与 其 相关 的 数据 往往 要 比 扩展 一 个 大 型 的 中 央 计 算 机 更 
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加 容易 、 更 加 经 济 。 而 且 ， 和 破坏 现 有 的 用 户 的 机 会 也 会 比 修改 或 扩展 中 央 计 算 机 系统 的 
情况 少 得 多 。 

* 较 低 的 通信 成 本 ”采用 分 布 式 系 统 ， 数 据 可 以 存放 在 与 用 户 距离 较 近 的 地 点 。 与 中 央 系 
统 相 比较 ， 这 种 方式 能 降低 通信 成 本 。 

*。 较 快 的 响应 根据 数据 的 分 布 情况 ， 在 某 个 站 点 的 用 户 的 大 多 数 数据 请 求 是 能 够 利用 该 站 
点 所 存放 的 数据 来 满足 的 。 这 样 可 以 加 快 查询 处 理 的 速度 ， 因 为 通信 和 中 央 计 算 机 的 延 
述 能 够 达到 最 小 。 也 可 以 把 复杂 的 查询 分 解 成 能 够 在 几 个 站 点 并 行 处 理 的 子 查 询 ， 以 提 
供 更 快 的 响应 。 

分 布 式 数 据 库 系统 也 会 面临 一 定 的 成 本 和 不 利 因素 : 

“软件 成 本 和 复杂 性 分 布 式 数 据 库 环境 需要 比较 复杂 的 软件 (尤其 是 DBMS)。 

我 们 将 在 本 章 后 面 讨论 这 种 软件 。 

“ 处理 开 销 ”各 个 站 点 必须 交换 消息 并 执行 附加 的 计算 ， 以 确保 不 同 站 点 的 数据 之 间 真正 
协调 。 

* 数据 完整 性 增加 复杂 性 以 及 协调 需求 的 一 个 副作用 是 ， 数 据 完整 性 的 不 正确 更 新 和 其 他 
问题 会 暴露 出 来 。 

* 响应 慢 如 果 数 据 按 其 使 用 没有 正确 分 布 ， 或 者 查询 没有 正确 地 编写 ， 那 么 对 于 数据 请 求 
的 响应 可 能 就 特别 慢 。 这 些 问 题 将 在 本 章 稍 后 的 内 容 中 加 以 讨论 。 


13.3 数据 库 实 施 分 布 式 处 理 的 策略 


一 个 数据 库 应 当 如 何在 网 络 的 站 点 (或 结 点 ) 之 间 进 行 分 布 呢 ? 我 们 在 第 6 章 里 讨论 过 物 
理 数据 库 设计 的 重要 问题 ,其 中 介绍 了 一 个 分 析 过 程 ， 用 来 评估 可 选 的 分 布 式 策略 。 在 本 章 中 ， 
我 们 注意 到 ， 分 布 式 数据 库存 在 四 种 基本 策略 : 

1) 数据 复制 。 

2) 水 平分 割 。 

3) 垂直 分 割 。 

4) 以 上 的 组 合 。 

我 们 以 关系 数据 库 为 例 来 说 明 这 些 方法 。 同 样 的 概念 也 可 以 应 用 ( 稍 许 有 些 变化 ) 到 其 他 
的 数据 模型 ， 比 如 层次 数据 模型 或 网 状 数据 模型 。 

假设 一 家 银行 在 某 个 州 有 许多 支行 。 该 银行 数据 库 的 基本 关系 之 一 是 Customer 关 系 。 图 
13-4 显 示 了 该 关系 的 一 个 简化 版 本 。 为 简单 起 见 ， 关 系 中 的 样本 数据 只 应 用 到 两 个 支行 
(Lakeview 和 Valley)。 这 个 关系 的 主键 是 账号 (Acct_Number)。 顾 客 开户 的 支行 名 称 为 
Branch_Name (因此 假设 他 们 是 在 该 支行 完成 其 大 部 分 事务 的 )。 


Acct_Number Customer_Name Branch_Name Balance 


200 Jones Lakeview 
324 Smith Valley 
153 Gray Valley 


426 Dorman Lakeview 

500 Green Valley 
Mclntyre Lakeview 
Elmore Lakeview 








图 13-4 银行 的 Customer 关 系 





448 和 五 亦 分 ”数据库 的 高 级 主题 





13.3.1 数据 复制 

数据 分 布 一 个 日 益 流 行 的 可 选项 是 每 两 个 (或 多 个 ) 站 点 就 存放 一 份 单独 的 数据 库 拷贝 。 
复制 允许 IS 组 织 将 数据 库 从 中 央 主 机 移动 到 更 加 接近 用 户 的 、 花 费 较 少 的 部 门 或 专用 位 置 服务 
器 上 ( 见 Koop,1995)。 复制 既 能 采用 同步 分 布 式 数 据 库 技术 ， 也 能 采用 异步 分 布 式 数据 库 技术 ， 
不 过 异步 技术 在 复制 环境 里 更 为 常见 。 例 如 ， 图 13-4 中 的 Customer 关 系 可 以 存储 在 Lakeview 或 
者 Valley 中 。 倘 车 在 每 一 个 站 点 都 存放 一 个 拷贝 ， 那 么 我 们 就 进行 了 完全 复制 (除非 只 有 少数 
相关 的 数据 库 ， 否 则 这 也 是 不 实际 的 )。 

数据 复制 有 五 个 好 处 : 

1) 可 靠 性 如 果 包 含 该 关系 (或 数据 库 ) 的 一 个 站 点 发 生 故 障 ， 那 么 无 须 网 络 传 输 延迟 也 
能 够 在 其 他 站 点 上 找到 一 个 拷贝 。 而 且 ， 所 使 用 的 拷贝 完全 可 以 在 事务 发 生 时 快速 进行 更 新 。 
一 旦 它们 归还 服务 器 ， 未 使 用 的 结 点 也 会 得 到 更 新 。 

2) 快速 响应 具有 完全 拷贝 的 每 个 站 点 能 在 本 地 处 理 查 询 ， 因而 查询 处 理 的 速度 很 快 。 

3) 可 避免 复杂 的 分 布 式 事务 完整 性 例 程 复制 后 的 数据 库 通 常 按 预定 的 时 间 间 隔 刷 新 ， 因 
此 ， 数 据 库 拷贝 的 同步 要 求 比较 宽松 时 ， 可 以 采用 各 种 复制 方式 。 

4) 结 点 无 须 耦 合 每 个 事务 在 进行 时 无 须 在 网 络 上 协调 。 因 此 ， 如 果 结 点 故障 、 忙 碌 或 不 
能 连通 时 (比如 在 移动 式 个 人 计算 机 中 )， 事 务 可 以 在 用 户 希望 的 时 候 进 行 处 理 。 代 赫 更 新 的 
实时 同步 ， 某 个 幕后 的 过 程 在 协调 着 所 有 的 数据 拷贝 。 

5) 降低 高 峰 时 间 的 网 络 流量 数据 更 新 经 常会 发 生 在 业务 高 峰 时 间 段 内 ， 也 就 是 网 络 流 最 
高 、 快 速 响应 的 需求 也 最 大 的 时 候 。 具 有 延迟 更 新 拷贝 数据 的 复制 ， 就 可 以 将 发 送 更 新 的 网 络 
流量 发 送 到 其 他 结 点 ， 在 非 高 峰 时 间 段 处 理 。 

复制 有 两 个 主要 的 不 利 因素 : 

1) 存储 需求 具有 完全 拷贝 的 每 个 站 点 必须 具备 和 数据 集中 存放 一 样 多 的 存储 容量 。 每 个 
拷贝 都 需要 存储 空间 (其 成 本 是 不 断 下 降 的 ) ， 而 更 新 每 个 结 点 的 拷贝 也 需要 处 理 时 间 。 

2) 更 新 的 复杂 性 与 成 本 每 当 更 新 一 个 关系 时 ， 拥 有 拷贝 的 每 个 站 点 也 必须 (最终 ) 被 更 
新 。 正 如 以 后 在 讲述 提交 协议 时 会 看 到 的 ， 接 近 实时 的 同步 更 新 需要 小 心地 进行 协调 。 

基于 以 上 理由 ， 数 据 复制 在 绝 大 多 数 处 理 请 求 仅 为 读 取 、 数 据 相 对 静态 的 场合 (比如 目录 、 
电话 矫 、 列 车 时 刻 表 等 ) 很 受 欢迎 。CD-ROM 和 DVD 有 望 成 为 一 种 复制 数据 库 的 经 济 实用 的 
载体 。 复 制 是 用 于 “ 非 捆绑 型 数据 ”的 ， 即 一 个 位 置 上 的 数据 不 需要 实时 更 新 别 的 位 置 上 保存 
的 数据 ( 见 Thé,1994)。 在 这 些 应 用 软件 中 ， 数 据 最 终 会 进行 同步 、 尽 量 快 是 比较 实用 的 。 复 
制 对 于 联机 应 用 软件 ， 比 如 机 票 预约 、 自 动 提 款 机 事务 以 及 其 他 金融 活动 是 不 可 行 的 ， 因 为 其 
中 每 一 个 用 户 所 需要 的 都 是 相同 的 非 共 享 数据 。 

1. 快照 复制 

更 新 数据 拷贝 有 各 种 模式 。 有 些 应 用 软件 ， 如 决策 支持 和 数据 仓库 或 挖掘 应 用 (它们 不 需 
要 当前 数据 )， 只 利用 简单 的 表 拷 贝 或 周期 性 快照 。 其 工作 过 程 如 下 。 假 定 多 个 站 点 正在 更 新 相 
同 的 数据 。 首 先 ， 把 来 自 所 有 要 复制 的 站 点 的 更 新 周期 性 地 汇总 在 某 个 主机 或 主 站 点 上 ， 其 中 
所 有 的 更 新 形成 了 所 有 变更 的 合并 记录 。 利 用 某 个 分 布 式 DBMS， 把 这 些 变 更 清单 汇总 在 快照 日 
志 里 ， 该 日 志 是 要 进入 快照 的 记录 的 行 标识 符 的 一 个 表 。 然 后 ， 在 此 主 站 点 ， 产 生 该 数据 库 复 
制 部 分 的 只 读 快照 。 最 后 ， 将 此 快照 发 送 到 存在 拷贝 的 每 个 站 点 ( 即 其 他 站 点 “订阅 ” 主 站 点 
所 拥有 的 数据 )。 这 也 称 为 数据 库 的 完全 刷新 ( 见 Edelstein，1995a; Buretta，1997 )。 另 - -种 情况 是 ， 
自从 上 一 次 快照 以 来 ， 只 发 送 变更 的 页 面 ， 这 称 为 微分 刷新 或 增 量 刷 新 。 在 这 种 情况 下 ， 每 个 
复制 表 的 快照 日 志 是 与 关联 的 库 联结 在 一 起 的 ， 以 形成 需要 发 送 到 复制 站 点 的 有 变更 行 的 集合 。 
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有 些 形 式 的 复制 管理 允许 数据 的 所 有 权 动 态 变化 ， 其 中 更 新 要 复制 数据 的 权限 是 一 个 站 点 
一 个 站 点 地 移动 的 ， 但 在 任何 时 刻 都 仅 有 一 个 站 点 有 更 新 权限 。 动 态 所 有 权 比 较 适 合 于 业务 活 
动 随 着 时 间 而 变动 的 情况 ， 或 者 其 中 数据 处 理 遵循 由 其 他 数据 库 服 务 器 所 支持 的 业务 单位 上 工 
作 流 的 场合 。 

复制 管理 的 最 后 一 种 形式 是 允许 数据 所 有 权 的 共享 。 共 享 更 新 会 引起 管理 站 点 上 更 新 冲突 
管理 的 严重 问题 。 例 如 ， 当 两 个 支行 的 提 款 机 试图 同时 更 新 顾客 的 地 址 时 会 怎么 样 ? 异 步 技术 
允许 冲突 暂时 存在 。 只 要 更 新 对 于 业务 操作 并 不 关键 ， 而 且 这 类 冲突 可 以 被 检测 出 来 ， 并 在 造 
成 实际 业务 问题 之 前 加 以 解决 ， 就 依然 可 以 使 用 这 种 方法 。 

完成 快照 刷新 的 成 本 取决 于 该 快照 是 简单 还 是 复杂 。 所 谓 简单 快照 就 是 仅仅 参照 一 个 表 的 
全 部 或 一 部 分 。 复 杂 的 快照 涉及 多 个 表 ， 通 常 来 自 涉及 联结 的 事务 (比如 输入 顾客 订单 和 相关 
的 产品 项 目 )。 在 某 些 分 布 式 DBMS 里 ， 简 单 快 照 可 以 通过 微分 型 刷新 来 处 理 ， 而 复杂 快照 却 
需要 比较 费时 的 完全 刷新 。 有 些 DBMS 仅 仅 支持 简单 快照 。 

2. 接近 实时 复制 

为 了 满足 接近 实时 的 需求 ， 为 每 个 已 完成 事务 存储 和 转发 消息 可 以 通过 网 络 进行 广播 ， 通 
知 所 有 的 结 点 尽快 地 更 新 数据 ， 在 发 端 结 点 的 数据 库 更 新 之 前 ， 并 不 强迫 初始 结 点 的 某 个 配置 
(就 像 下 面 将 要 讨论 的 利用 协调 的 提交 协议 的 情形 ， 见 Schussel，1994)。 产 牛 此 类 消息 的 一 个 
办 法 是 使 用 触发 器 (在 第 8 章 讨论 过 )。 触 发 器 可 能 存放 在 每 个 本 地 数据 库 里 ， 每 当 更 新 了 一 段 复 
制 数据 ， 触 发 器 便 执行 相应 的 更 新 命令 以 响应 远程 的 数据 库 复制 ( 见 Edelstein，1993)。 采 用 触 
发 恬 ， 每 一 个 数据 库 更 新 事件 都 可 以 对 程序 和 用 户 单独 、 透 明 地 进行 处 理 。 如 果 网 络 与 某 个 结 
点 的 链接 断 开 或 结 点 繁忙 ， 则 通知 结 点 更 新 其 数据 库 的 这 些 消 息 就 被 放 入 一 个 队列 等 待 处 理 。 

3. 下拉 式 复制 

以 上 对 于 复制 品 同步 化 所 阐述 的 模式 全 都 是 下 推 式 策略 的 例子 。 也 存在 下 拉 式 的 策略 。 在 
下 拉 式 策略 里 ， 当 更 新 本 地 数据 库 时 ， 控 制 的 是 目标 结 点 而 非 原始 结 点 。 采 用 下 拉 式 策略 ， 本 
地 数据 库 确定 何 时 需要 刷新 ， 并 请 求 一 个 快照 或 者 清空 某 个 更 新 消息 队列 。 下 拉 式 策略 的 好 处 
是 ， 它 所 要 求 的 是 本 地 站 点 控制 ， 并 能 处 理 更 新 。 从 而 ， 同 步 化 很 少 混乱 ， 仅 在 每 个 站 点 都 要 
求 时 才 会 出 现 ， 而 并 非 是 主 站 点 自 认 为 最 好 更 新 的 时 候 。 

4. 复制 的 数据 库 完 整 性 

无 论 是 周期 性 复制 还 是 接近 实时 的 复制 ， 都 需要 力求 其 分 布 的 、 复 制 的 数据 库 是 一 致 的 。 
无 论 是 延迟 还 是 接近 实时 ， 管 理 复制 数据 库 的 DBMS 仍 然 必须 确保 数据 库 的 完整 性 。 决 策 支持 
应 用 软件 允许 基于 表 - 表 进 行 同 步 ， 而 接近 实时 应 用 软件 却 要 求 事务 -事务 之 间 的 同步 。 然 而 ， 
在 这 两 种 情况 下 ，DBMS 都 必须 确保 每 个 应 用 软件 需求 的 拷贝 都 同步 。 

采用 复制 数据 库 处 理 更 新 的 难度 也 取决 于 可 能 进行 更 新 的 结 点 的 数目 ( 见 Froemming, 1996 ) 。 
在 单一 更 新 者 环境 里 ， 经 常 是 通过 周期 性 地 发 送 要 更 新 的 数据 库 片段 的 只 读数 据 库 快照 到 非 更 
新 者 结 点 来 处 理 的 。 这 时 ， 对 于 只 读 站 点 ， 多 重 更 新 的 效果 可 以 有 效 地 批量 化 。 比 如 产品 目录 、 
价格 清单 以 及 汽车 销售 力 的 其 他 参考 数据 就 属于 这 种 情况 。 在 有 多 个 更 新 者 的 环境 里 ,。 最 明显 
的 问题 是 数据 冲突 。 在 每 个 独立 运行 更 新 的 结 点 都 试图 在 同一 时 间 更 新 则 样 的 数据 时 ， 就 可 能 
会 遇 到 数据 冲突 。 此 时 ，DBMS 必 须 包括 一 种 机 制 来 检测 和 处 理 数据 冲突 。 例 如 ，DBMS 必 须 规 
定 ， 如 果 结 点 在 处 理 时 发 生 冲 突 ， 那 么 该 处 理应 当 挂 起 ， 直 到 数据 冲突 被 化 解 为 止 。 

5. 何 时 使 用 复制 

复制 是 否 是 分 布 式 数据 库 可 行 的 设计 选项 ， 这 取决 于 以 下 几 个 因素 ( 见 Froemming，1996): 

1) 数据 及 时 性 容许 过 期 数据 (无 论 是 几 秒 钟 还 是 几 小 时 ) 的 应 用 软件 是 复制 的 最 佳 候 
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选项 。 

.2) DBMS 幼 能 DBMS 一 个 重要 功能 是 ， 它 是 否 支持 需要 参照 多 个 结 点 数据 的 查询 ? 如 果 
不 支持 ， 那 么 复制 就 是 比 下 一 节 要 讲 的 分 割 模式 更 好 的 备 选项 。 

3) 性 能 内 涵 复制 意味 着 每 个 结 点 周期 性 地 进行 刷新 。 当 进行 刷新 时 ， 分 布 的 结 点 可 能 在 
非常 人 碌 地 处 理 大 量 的 更 新 。 如 果 刷 新 的 出 现 是 由 事件 触发 的 〈 例 如 ， 积 累 了 一 定数 量 的 变更 
时 候 )， 那 么 当 远 程 结 点 正在 忙于 完成 本 地 工作 时 ， 刷 新 可 能 就 出 现 一 次 。 

4) 网 络 中 的 异 构 性 如 果 不 同 的 结 点 使 用 不 同 的 操作 系统 、DBMS 或 者 更 常见 的 是 ， 使 用 
不 同 的 数据 库 设计 时 ， 复 制 可 能 会 比较 复杂 。 将 变更 从 一 个 站 点 映射 到 n 个 站 点 可 能 意味 着 有 n 
个 不 同 的 例 程 用 来 把 发 端 结 点 的 变更 转化 成 其 他 结 点 处 理 可 接受 的 模式 。 

5) 通信 网 络 功能 数据 通信 网 络 的 传输 速度 和 容量 可 能 会 禁止 非常 大 的 表 的 频繁 完全 刷新 。 
然而 ， 复 制 根 本 不 需要 专用 的 通信 连接 。 因 此 ， 廉 价 的 共享 网 络 就 能 用 于 数据 库 快 照 的 传输 。 
13.3.2 水 平分 割 

利用 水 平分 割 ( 见 第 6 章 对 各 种 形式 的 表 分 割 的 描述 )， 可 以 把 一 个 表 (或 关系 ) 的 某 些 行 
放 和 一 个 站 点 的 基 关 系 中 ， 而 将 其 他 行 放 入 别 的 站 点 的 基 关 系 中 。 一 般 说 来 ， 一 个 关系 的 行 是 
分 布 于 许多 站 点 的 。 

图 13-5 显 示 了 将 Customer 关 系 进行 水 平分 割 的 结果 。 每 一 行 现在 都 位 于 其 开户 支行 。 如 果 
顾客 的 事务 通常 在 开户 支行 完成 ， 那 么 事务 就 可 以 在 本 地 进行 处 理 ， 响 应 时 间 也 最 少 。 当 顾客 
在 别 的 支行 处 理 其 事务 ， 那 么 为 了 处 理 就 要 把 该 事务 传输 到 开户 支行 ， 并 把 其 响应 传输 回 其 处 
理 支行 (这 就 是 使 用 ATM 的 常见 模式 )。 如 果 顾 客 的 使 用 模式 改变 (或 许 是 由 于 搬家 缘故 )， 系 
统 可 以 检测 出 这 种 变化 ， 并 动态 地 将 记录 移 到 处 理 绝 大 多 数 事务 的 位 置 。 归 纳 起 来 ， 分 布 式 数 
据 库 的 水 平分 割 具 有 四 大 好 处 : 

1) 效率 数据 存放 在 最 接近 它们 使 用 地 的 地 方 ， 并 与 其 他 用 户 或 应 用 软件 所 使 用 的 数据 相 
分 离 。 

2) 本 地 优化 数据 可 以 存储 起 来 ， 以 优化 本 地 访问 的 性 能 。 

3) 安全 性 在 某 个 站 点 与 使 用 无 关 的 数据 不 可 用 。 

4) 查询 方便 很 容易 将 各 水 平分 割 中 的 数据 组 合 起 来 ， 因 为 各 分 割 中 的 数据 通过 并 操作 就 
可 以 合并 起 来 。 


Acct_Number Customer_Name Branch_Name Balance 


200 Jones Lakeview 1000 
426 Porman Lakeview 796 
683 Mecintyre Lakeview 1500 
252 Elmore Lakeview 330 





2a) Lakeview 支 行 


Acct_ Number Customer_Name Branch_ Name Balance 


324 Smith Valley 250 
153 Gray Valley 38 
500 Green Valley 168 





b) Valley 支 行 


图 13-5 水 平分 割 
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因此 ， 当 组 织 功能 为 分 布 式 的 时 候 ， 经 常 采 用 水 平分 割 ， 但 每 个 站 点 仅仅 关心 实体 事例 
(频繁 地 基于 地 理 位 置 ) 的 一 个 子 集 。 


水 平分 割 也 有 两 个 不 利 因素 : 
1) 不 一 致 的 访问 速度 当 要 求 使 用 几 个 分 割 中 的 数据 时 ， 其 访问 时 间 可 能 与 仅仅 完成 本 地 
数据 访问 的 速度 相去 其 远 。 


2) 备份 脆弱 性 ”由 于 数据 没有 复制 ， 所 以 一 旦 数据 在 一 个 站 点 变 得 无 法 访问 或 草 到 破坏 ， 
则 不 能 切换 到 其 他 存在 拷贝 的 站 点 ; 倘若 没有 在 每 个 站 点 完成 真正 的 备份 ， 则 数据 就 会 丢失 。 
13.3.3 垂直 分 割 

采用 符 直 分 害 〈 请 参见 第 6 章 )， 某 个 关系 的 一 些 列 被 投影 到 一 个 站 点 的 基 关 系 ， 而 其 他 列 
则 被 投影 到 另 一 些 站 点 的 基 关 系 (更 常见 的 是 ， 列 被 投影 到 几 个 站 点 上 )。 每 个 站 点 的 关系 必 
须 共享 一 个 公共 域 以 使 能 够 重新 构造 原始 表 。 

为 了 说 明 垂 直 分 割 ， 我 们 利用 图 13-6 所 示 的 某 个 制造 公司 应 用 软件 。 图 13-7 显 示 了 以 
Part_Number 为 主键 的 Part 关 系 。 其 中 一 部 分 数据 供 制造 部 使 用 ， 而 另 一 部 分 则 主要 由 工程 部 使 
用 。 数 据 采用 垂直 分 割 方法 分 布 于 相应 的 部 门 计 算 机 中 ， 如 图 13-8 所 示 。 图 13-8 中 的 每 个 分 割 
是 通过 对 原始 关系 作 投影 〈( 即 选 定 列 ) 而 获得 的 。 而 原始 关系 则 可 以 通过 对 所 产生 的 分 割 进行 
自然 联结 而 获得 。 

归纳 起 来 ， 除 了 在 垂直 分 割 上 进行 数据 组 合 要 比 在 水 平分 割 上 更 为 困难 以 外 ， 水 平分 割 与 
垂直 分 割 的 利 王 完全 相同 。 这 一 困难 主要 是 由 于 需要 匹配 主键 或 其 他 条 件 ， 以 便 联结 分 割 上 的 
行 而 造成 的 。 水 平分 割 支持 其 功能 通常 是 按 地 域 为 基础 加 以 复制 的 组 织 型 设计 ， 而 垂直 分 区 则 
通常 应 用 于 经 过 合理 分 割 的 数据 需求 之 组 织 型 功能 。 














[ 程 部 计算 机 





制造 部 


数据 库 








CADICAM 工 作 站 


图 13-6 某 个 制造 公司 的 分 布 式 处 理 系统 
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Part_Number Name Drawing_Number Qty_on_Hand 
P2 Widget 100 123-7 20 
P7 Gizmo 550 60621-0 100 
P3 Thing 48 174-3 0 
Pl Whatsit 220 416-2 16 
PS Thumzer 16 321-0 50 
p9 Bobpit 75 400-1 0 
P6 Nailit 125 129-4 200 








图 13-7 Part 关 系 








Part_Number Drawing_Number Part_Number 





Cost Qty_On_Hand 











Widget 
P7 Gizmo 550 100 





P3 Thing 48 0 
Pl Whatsit 220 16 
P8 Thumzer 16 50 







Bobbit 
Nailit 








a) 工程 部 b) 制造 部 
图 13-8 垂直 分 区 

13.3.4 操作 组 合 

前 述 策 略 几乎 有 无 限 多 个 组 合 ， 所 以 有 时 情况 更 为 复杂 。 有 些 数据 可 以 是 集中 存放 的 ， 而 
另外 一 些 数据 被 复制 到 各 个 站 点 里 。 而 且 ， 对 于 某 个 给 定 关 系 ， 水 平分 割 或 垂直 分 割 都 可 能 适 
合 于 数据 分 布 。 图 13-9 就 是 组 合 策略 的 一 个 例子 : 

1) Engineering Parts、Accounting 和 Customer 数 据 都 集中 存放 在 不 同 的 地 点 。 

2) 标准 零件 数据 在 三 个 位 置 上 进行 (水 平 ) 分 割 。 

3) 在 三 个 位 置 上 都 复制 有 Standard Price List。 









San Mateo Tulsa New York 


San Mateo Tulsa New York 
Parts Parts Parts 
Engineeri 、 
男 Pa 总 oe 画 “lomers 
Standard Standard Standard 
Price List Price List Price List 














图 13-9 数据 分 布 的 混合 策略 
(经 Miller Freeman Publjications 人 允许 ， 搞 自 “Database Programming & Design” ,April 1989, Vol.2, No.4) 
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分 布 式 数据 库 设计 的 原则 是 ， 数 据 应 当 存放 在 最 频繁 访问 它们 的 地 方 〈 虽 然 其 他 因素 ， 如 
安全 性 、 数 据 完 整 性 以 及 成 本 等 也 很 重要 )。 在 组 织 分 布 式 数 据 库 ， 决 定 其 成 为 分 布 式 而 不 是 
分 散 型 的 问题 上 ， 起 着 关键 和 中 心 作用 的 是 数据 管理 员 。 

13.3.5 选择 正确 的 数据 分 布 策略 

基于 前 几 节 的 讨论 ， 可 以 按照 五 种 独特 的 方式 组 织 一 个 分 布 式 数据 库 : 

1) 完全 集中 存放 在 一 个 位 置 ， 但 从 许多 地 理 上 分 布 的 站 点 进行 访问 。 

2) 地 理 上 分 布 的 站 点 上 部 分 或 完全 复制 ， 且 采用 快照 周期 性 地 更 新 每 份 拷贝 。 

3) 地 理 上 分 布 的 站 点 上 部 分 或 完全 复制 ， 且 采用 接近 实时 的 方式 同步 更 新 。 

4) 按 地 理 上 分 布 的 不 同 站 点 分 割 成 片段 ， 但 仍然 处 在 一 个 逻辑 数据 库 和 一 个 分 布 式 DBMS 


5) 分 割 成 独立 的 、 非 集成 的 散布 于 多 台 计 算 机 和 数据 库 软件 上 的 片段 。 

以 上 五 种 方法 没有 哪个 绝对 是 最 好 的 。 表 13-1 从 可 靠 性 、 增 加 结 点 的 可 扩展 性 、 通 信 开 销 
或 对 通信 网 络 的 需求 、 可 管理 性 以 及 数据 一 致 性 方面 比较 以 上 五 种 方法 。 分 布 式 数据 库 设计 者 
应 该 平衡 这 些 因素 以 便 选择 适合 给 定 分 布 式 数据 库 环 境 的 最 佳 策 略 。 在 给 定 情景 下 选择 哪 种 策 
略 取决 于 以 下 因素 。 





。 组 织 的 能 


可 用 的 资金 、 组 织 中 各 单位 的 自治 程度 和 安全 性 需求 。 


* 频 度 和 局 部 性 或 数据 参照 的 冲突 性 ”一般 来 说 ， 数 据 位 置 应 当 接 近 使 用 这 些 数 据 的 应 用 
软件 。 
表 13-1 分 布 式 数据 库 设 计策 略 的 比较 
策 略 可 扩展 性 通信 开销 可 管理 性 数据 -… 斑 性 
集中 式 差 : 差 : 很 高 : 很 好 : 优 : 
高 度 依赖 中 央 服 务 ”有 限 性 成 为 性 能 的 ”一 个 站 点 高 流入 一 个 站 点 需要 小 的 ”所 有 用 户 总 是 具有 
器 胖 垒 协调 相同 的 数据 
用 快照 复制 ”好 : 很 好 : 低 - 中 等 : 很 好 : 中 等 : 
匈 余 性 和 可 容 忠 的 ”增加 拷贝 成 本 可 能 ”不 固定 . 但 周期 性 ”每 个 拷贝 都 非常 相 只 要 业 务 能 够 容 钨 
延迟 小 于 线性 快照 可 能 造成 网 络 ” 似 定 的 延 了 过 
流量 突 增 
同步 复制 ”优秀 : 很 好 : 中 等 : 中 等 : 中 等 ~ 很 好 : 
匈 余 性 和 最 小 延迟 ”增加 拷贝 的 成 本 消息 固定 ， 但 允许 “冲突 会 给 管理 增加 接近 精确 - 伊 性 
低 ， 同步 化 工作 仅 ”有些 延迟 一 些 复杂 性 
线性 
集成 分 割 很 好 : 很 好 : 低 ~ 中等: 淮 : 很 差 : 
有 效 利用 分 割 和 宛 ”新 结 点 只 获得 所 需 ”查询 多 为 本 地 ,但 要 求 分 布 式 表 和 更 ”需要 付出 相当 的 努 
余 性 的 数据 ， 无 须 变更 ”需要 多 站 点 数据 的 ”新 必须 紧密 协调 的 力 ， 不 一 敏 性 相当 
总 体 数据 库 设 计 查询 可 能 引起 暂时 ”查询 尤其 困难 严重 
性 负载 
采用 独立 分 好: 好 : 低 : 很 好 : 低 : 
制 的 分 散 式 ”只 依赖 本 地 数据 库 ”新 站 点 独立 于 即使 需要 在 网 络 上 ”每 个 站 点 都 很 容易 ”不 保证 . -至 性 ， 实 
可 用 性 已 有 的 站 点 发 送 数据 或 查询 ， 管理 ， 除 非 存在 共 “ 际 多 半 不 …- 笃 
其 负载 也 很 小 (如 ” 享 站 点 数据 的 楼 求 
果 存 在 ) 


OO 
“对 于 增长 和 扩展 的 要 求 网 络 上 处 理 器 的 可 用 性 将 影响 到 数据 可 能 存放 的 位 置 和 应 用 软件 
运行 的 位 置 ， 并 指示 出 网 络 需要 扩展 的 要 求 。 . 
"技术 能 力 必须 考虑 到 每 个 结 点 的 功能 ， 对 于 DBMS 来 说 还 要 考虑 获得 和 管理 该 技术 的 成 





454 荔 五 部 分 ”数据库 的 高 级 王 题 











本 。 存 储 成 本 不 断 降低 ， 但 管理 复杂 技术 的 成 本 却 可 能 会 增加 。 
* 可靠 服务 的 要 求 以 任务 为 主 的 应 用 软件 和 频繁 需要 的 数据 应 该 使 用 复制 模式 。 


13.4 分 布 式 DBMS 


为 了 拥有 分 布 式 数据 库 ， 必 须 有 一 个 数据 库 管理 系统 来 协调 各 个 站 点 上 的 数据 访问 。 我 们 
将 这 类 系统 称 为 分 布 式 DBMS。 虽 然 每 个 站 点 都 有 一 个 DBMS 在 管理 本 站 点 的 本 地 数据 库 ， 但 
分 布 式 DBMS 则 将 完成 下 列 功 能 ( 见 EImasri 和 Navathe, 1989; Buretta, 1997): 

1) 在 分 布 式 数据 词典 里 维护 数据 存放 的 位 置 。 这 意味 着 ， 向 开发 者 和 用 户 部 分 地 表示 一 个 
逻辑 数据 库 和 模式 。 

2) 无 须 开发 者 或 用 户 进行 任何 专门 操作 ， 就 能 确定 所 请 求 数据 的 位 置 ， 以 及 处 理 分 布 式 查 
询 每 一 部 分 所 在 的 位 置 。 

3) 倘若 必要 ， 把 一 个 结 点 上 采用 本 地 DBMS 的 请 求 翻译 成 正确 的 其 他 站 点 上 采用 不 同 的 
DBMS 和 数据 模型 的 请 求 ， 并 以 发 出 请 求 的 结 点 所 能 接受 的 格式 将 数据 返回 。 

4) 提供 诸如 安全 性 、 并 发 性 与 死 锁 控制 、 全 局 查询 优化 以 及 自动 故障 记录 与 恢复 等 数据 管 
理 功 能 。 

5) 提供 远程 站 点 上 数据 拷贝 的 一 致 性 (例如 ， 采 用 多 阶段 提交 协议 )。 

6) 表现 为 单一 逻辑 数据 库 ， 它 在 物理 上 是 分 布 的 。 这 种 数据 视图 的 衍生 物 之 一 就 是 全 局 主 
键 控制 ， 即 关于 同一 业务 对 象 的 数据 总 是 与 相同 主键 相 联系 的 ， 而 与 分 布 式 数据 库 里 数据 的 存 
储 位 置 无 关 ， 不 同 的 对 象 总 是 与 不 同 的 主键 相 联系 。 

7) 可 伸缩 。 可 伸缩 性 就 是 规模 可 以 增 大 或 者 减 小 ， 当 业务 需求 改变 时 ， 可 伸缩 性 就 变 得 更 
加 蜡 构 了 。 因 此 、 分 布 式 数据 库 必须 是 动态 的 ， 并 且 能 够 在 合理 的 范围 内 变化 ， 而 无 须 重新 设 
计 。 可 伸缩 性 也 意味 着 有 了 更 简便 的 办 法 来 添加 (或 订阅 ) 新 站 点 以 及 初始 化 新 站 点 (如 采用 
复制 数据 )。 

8) 复制 分 布 式 数据 库 各 结 点 上 的 数据 和 存储 过 程 。 与 分 布 数据 的 理由 相同 ， 也 需要 对 存储 

9) 透明 地 利用 剩余 的 计算 机 功能 来 改善 数据 库 处 理 的 性 能 。 例 如 ， 这 意味 着 同一 个 数据 库 
查询 ， 若 在 不 同 的 时 间 提 交 ， 就 可 以 用 不 同 的 方式 在 不 同 的 站 点 进行 处 理 ， 这 取决 于 查询 提交 
时 分 布 式 数据 库 上 的 工作 负载 。 

10) 允许 不 同 的 结 点 运行 不 同 的 DBMS 。 分 布 式 DBMS 和 每 个 本 地 DBMS 可 以 使 用 中 间 件 
( 见 第 9 章 ) 来 弥补 查询 语言 和 本 地 数据 的 细微 差别 。 

11) 允许 在 分 布 式 数 据 库 的 不 同 结 点 上 驻 留 不 同 版 本 的 应 用 软件 代码 。 在 具有 多 个 分 布 式 
服务 器 的 大 型 组 织 里 ， 让 每 个 服务 器 / 结 点 都 运行 相同 版 本 的 软件 显得 不 太 实际 。 

并 非 所 有 的 分 布 式 DBMS 都 能 完成 上 述 的 所 有 功能 。 儿 乎 每 个 可 行 的 分 布 式 DBMS 里 都 具 

备 前 6 项 功能 。 而 其 余 的 功能 则 按 其 重要 性 程度 以 及 在 现代 技术 中 使 用 的 频率 ， 以 近似 降序 排 
列 出 来 。 . 
从 概念 上 说 ， 每 个 本 地 站 点 都 可 能 运行 各 种 不 同 的 DBMS ， 采 用 一 个 主 DBMS 来 控制 数据 
库 部 分 的 交互 。 正 如 本 章 前 面 所 定义 的 ， 这 类 环境 称 为 异 构 分 布 式 数据 库 。 目 前 ， 尽管 理想 、 
完全 的 异 构 还 无 法 实现 ， 但 当 每 个 DBMS 具 备 相同 的 数据 体系 结构 (例如 关系 ) 时 ， 某 些 产品 
还 是 在 一 定 程度 上 具有 异 构 性 的 。 

图 13-10 显 示 了 具有 分 布 式 DBMS 功 能 的 计算 机 系统 的 一 种 流行 的 体系 结构 。 每 个 站 点 都 
有 一 个 本 地 DBMS ， 用 于 管理 存放 在 本 站 点 的 数据 库 。 而 且 ， 每 个 站 点 都 有 该 分 布 式 DBMS 的 
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一 个 拷贝 和 相关 的 分 布 式 数据 词典 /目录 (DD/D)。 该 分 布 式 DD/D 包 含 网 络 中 所 有 数据 的 位 置 以 
及 数据 定义 。 用 户 或 应 用 软件 对 数据 的 请 求 首先 由 分 布 式 DBMS 处 理 ， 它 会 判断 出 所 请 求 的 事 
务 究竟 是 局 部 的 还 是 金 局 的 。 本 地 事务 (local transaction) 就 是 其 请 求 的 数据 全 部 存放 在 本 地 
站 点 的 事务 ， 而 全 局 事务 (globai transaction) 则 需要 引用 一 个 以 上 的 非 本 地 站 点 的 数据 才能 
满足 其 请 求 。 对 于 本 地 事务 ， 分 布 式 DBMS 将 请 求 发 送 到 本 地 DBMS; 而 对 于 全 局 事务 ， 分 布 
式 DBMS 则 按 要 求 将 请 求 传送 到 其 他 的 站 点 。 根 据 协 调 事务 处 理 的 需要 ， 分 布 式 DBMS 在 各 参 
与 站 点 交换 消息 ， 直 到 其 完成 (或 必要 时 被 中 止 ) 为 止 。 可 以 看 到 ， 这 个 过 程 是 十 分 复杂 的 。 
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图 13-10 分 布 式 DBMS 体 系 结构 


一 个 站 点 上 的 DBMS ( 及 其 数据 模型 ) 可 能 与 其 他 站 点 的 DBMS 是 不 同 的 。 例 如 ， 站 点 A 
可 能 具有 关系 DBMS， 而 站 点 B 具 有 网 状 DBMS。 这 时 ， 分 布 式 DBMS 就 必须 对 请 求 进行 翻译 ， 
使 它 能 够 被 各 本 地 DBMS 处 理 。 处 理 混合 型 DBMS 和 数据 模型 的 功能 是 一 种 刚刚 在 某 些 商 用 
DBMS 中 出 现 的 先进 技术 。 

在 分 布 式 系统 体系 结构 的 讨论 中 (参见 图 13-10)， 我 们 假设 每 个 站 点 都 存在 分 布 式 DBMS 
和 DD/D 的 拷贝 (因此 DD/D 本 身 就 是 数据 复制 的 一 个 例子 )。 另 一 种 情况 是 将 分 布 式 DBMS 和 
DD/D 放 置 在 中 央 站 点 ， 还 可 能 有 其 他 的 策略 。 然 而 ， 集 中 式 解决 方案 极 易 发 生 故障 ， 因 而 不 
太 理 想 。 

分 布 式 DBMS 应 当 使 用 户 与 分 布 式 数据 库 管理 系统 的 复杂 性 尽 可 能 分 隔 开 来 。 换 句 话说， 
分 布 式 DBMS 应 当 让 数据 在 网 络 中 的 位 置 以 及 分 布 式 数据 库 其 他 特性 变 得 透明 。 当 分 布 式 
DBMS 达 到 以 下 四 个 目标 时 ， 就 可 以 很 容易 地 构造 程序 并 检索 分 布 式 系统 里 的 数据 。 这 些 目 标 
包括 : 位 置 透明 性 、 复 制 透明 性 、 故 障 透 明 性 以 及 并 发 透明 性 。 为 了 深入 理解 故障 透明 性 和 并 
发 透明 性 ， 我 们 还 讨论 了 提交 协议 的 概念 。 最 后 描述 查询 优化 ， 这 也 是 分 布 式 DBMS 的 重要 功 
能 之 一 。 

13.4.1 位 置 透明 性 

尽管 数据 在 地 理 上 分 散 分 布 ， 并 能 随 着 位 置 的 变化 而 转移 ， 但 利用 位 置 透明 性 ， 用 户 ( 包 

括 程序 员 ) 却 能 够 将 所 有 数据 看 作 存放 在 单一 结 点 那样 进行 操作 。 为 了 解释 位 置 透明 性 ， 不 妨 
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考虑 图 13-9 所 示 的 分 布 式 数据 库 。 该 公司 在 加 里 弗 尼 亚 州 的 San Mateo、 俄 克拉 荷 马 州 的 Tulsa 
和 纽约 市 都 有 仓库 和 相关 的 采购 功能 。 公 司 的 工程 部 在 San Mateo ， 而 销售 部 在 纽约 市 。 假 设 
在 加 里 弗 尼 亚 州 San Mateo 的 营销 经 理 需 要 一 份 总 采购 量 小 于 $100 000 的 所 有 顾客 的 清单 。 由 
于 具有 位 置 透明 性 ， 所 以 该 经 理 可 以 从 San Mateo 的 终端 输入 下 列 请 求 : 

SELECT* 


FROM CUSTOMER 
WHERE TOTAL SALES<100,000; 


请 注意 ， 这 一 SQL 请 求 不 要 求 用 户 知道 数据 的 物理 存储 位 置 。 本 地 站 点 (San Mateo) 的 
分 布 式 DBMS 将 会 咨询 分 布 式 DD/D， 并 确定 这 一 请 求 必须 发 送 到 纽约 。 当 选 定 的 数据 在 San 
Mateo 传 输 与 显示 时 ， 该 站 点 的 用 户 觉 得 数据 是 化 本 地 检索 到 的 。( 除 非 存在 较 长 时 间 的 通信 延 
壕 ! ) 

现在 考虑 一 个 较为 复杂 、 需 要 检索 多 个 站 点 的 数据 的 请 求 。 例 如 ， 考 虑 图 13-9 里 的 Part 多 
辑 文件 , 它 是 按 地 理 位 置 分 割 , 存放 在 靠近 其 各 自 仓 库 位 置 的 计算 机 上 的 物理 分 布 数据 库 文件 : | 
San Mateo Part、Tujsa Part 和 NewYork Part。 假 设 Tulsa 的 库存 经 理 希望 得 到 一 份 有 关 桔 黄色 零 
件 的 清单 〈 不 管 其 位 置 )。 这 位 经 理 可 以 采用 下 列 查询 来 组 合 来 自 三 个 站 点 的 信息 : 

SELECT DISTINCT PART NUMBER,PART NAME 

FROM PART 
WHERE COLOR= 'Orange 
ORDER BY PART NO; 


在 编写 查询 时 ， 用 户 不 必 考 虑 零件 数据 存放 在 各 个 站 点 (假设 具备 位 置 透明 性 )， 因 此 ， 这 是 
一 个 全 局 事务 。 若 没有 位 置 透明 性 ， 用 户 就 应 当 分 别 引 用 每 个 站 点 的 零件 数据 ， 然 后 组 合 数据 
( 可 能 要 使 用 UNION 操 作 )， 以 产生 所 要 的 结果 ，。 
如 果 DBMS 不 直接 支持 位 置 透明 性 ， 那 么 数据 库 管 理 员 可 以 通过 创建 视图 ( 见 第 8 章 对 使 
用 SQL 的 视图 的 讨论 )， 为 用 户 实现 虚拟 的 位 置 透明 性 。 对 于 图 13-9 所 示 的 分 布 式 数据 库 ， 下 
列 视图 虚拟 地 在 一 张 表 里 合 并 零件 记录 : 
CREATE VIEW ALL PART AS 
{SELECT PART NUMBER,PART NAME FROM SAN_ MATEO_ PART 
UNION | 
SELECT PART_NUMBER,PART NAME FROM TULSA_ PART 
UNION 
SELECT PART_ NUMBER,PART NAME FROM NEW YORK PART); 


其 中 三 个 零件 表 名 字 是 三 个 远程 站 点 的 表 的 同义词 。 

前 面 的 例子 是 关于 只 读 事务 的 。 本 地 用 户 是 否 也 可 以 更 新 某 个 (或 几 个 ) 远 程 站 点 的 数据 ? 
利用 现代 的 分 布 式 DBMS 产 品 ， 用 户 当 然 可 以 更 新 存放 在 某 个 远程 站 点 的 数据 ， 比 如 本 例 中 的 
Customer 数 据 。 因 此 ， 位 于 Tulsa 的 用 户 能 够 更 新 存放 在 San Mateo 的 BOM (原材料 清单 ) 数据 。 
当 更 新 存储 在 多 个 站 点 的 数据 (比如 Vendor 文 件 ) 的 时 修 ， 会 遇 到 比较 复杂 的 问题 ， 我 们 将 在 
下 一 节 讨 论 这 个 问题 。 

为 了 实现 位 置 透明 性 ， 分 布 式 DBMS 必 须 能 够 访问 某 个 精确 的 、 当前 的 数据 词典 /目录 ， 以 
指示 网 络 中 所 有 数据 的 位 置 。 若 该 目录 是 分 布 的 (如 图 13-9 所 示 的 体系 结构 )， 它们 必须 是 同 
步 的 ， 这 个 目录 的 每 一 份 拷贝 都 反映 关于 数据 位 置 的 相同 的 信息 。 尽管 这 方面 取得 了 很 大 的 进 
展 , 但 在 绝 大 多 数 现代 系统 里 ， 仍 然 还 未 能 提供 真正 的 位 置 透明 性 。 
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13.4.2 复制 透明 性 

虽然 一 个 给 定 的 数据 项 可 以 在 网 络 的 多 个 结 点 上 复制 ， 但 利用 复制 透明 性 (replication 
transparency， 有 时 也 称 为 片段 透明 性 )， 程 序 员 (或 者 其 他 用 户 ) 仍然 可 以 把 该 数据 项 当成 是 
位 于 某 一 结 点 上 的 单个 数据 项 进行 处 理 。 | 

为 了 说 明 复 制 透明 性 ， 让 我 们 来 看 一 下 Standard Price List 文 件 〈 参 见 图 13-9)。 在 所 有 三 
个 结 点 上 都 有 一 个 与 该 文件 相同 的 拷贝 (完全 复制 )。 首 先 考 虑 在 每 个 结 点 处 读 取 部 分 (或 全 部 ) 
文件 的 问题 。 分 布 式 DBMS 将 会 访问 数据 词典 ， 并 确定 它 是 一 个 本 地 事务 ( 即 可 以 只 利用 本 地 
站 点 的 数据 来 完成 的 事务 )。 因 此 ， 用 户 不 必 担 心 要 在 其 他 站 点 上 存储 的 相同 数据 。 

现在 假设 只 在 部 分 (而 非 全 部 ) 站 点 上 复制 数据 (部 分 复制 )。 如 果 这 个 读 请 求 是 从 某 个 
不 包含 被 请 求 数据 的 站 点 发 出 的 ， 那 么 此 请 求 就 应 当 传 输 到 其 他 站 点 。 此 时 ， 分 布 式 DBMS 应 
当选 择 能 提供 最 快 响应 的 远程 站 点 。 站 点 的 选择 取决 于 网 络 的 当前 条 件 ( 比 如 通信 线路 的 可 用 
性 )。 因 此 ， 分 布 式 DBMS (与 其 他 网 络 工具 配合 使 用 ) 应 当 动态 地 选择 最 佳 路 径 。 利 用 复制 
透明 性 ， 发 出 请 求 的 用 户 就 不 用 担心 它 是 全 局 ( 非 本 地 ) 事务 。 

当 一 个 或 多 个 用 户 试 图 更 新 复制 的 数据 时 ， 就 会 出 现 更 为 复杂 的 问题 。 例 如 ， 假 设 纽约 的 
某 个 经 理想 到 改变 某 个 零件 的 单价 。 这 一 改变 必须 精确 地 、 并 发 地 在 所 有 三 个 站 点 上 实施 ， 否 
则 数据 会 不 一致。 利用 复制 透明 性 ， 纽 约 的 经 理 就 可 以 像 本 地 事务 那样 输入 数据 ， 也 不 必 担 心 
住所 有 三 个 站 点 上 完成 相同 的 更 新 。 然 而 ， 为 了 确保 数据 完整 性 ， 系 统 还 必须 提供 我 们 将 在 下 
一 节 讨论 的 并 发 透明 性 和 故障 透明 性 。 
13.4.3 故障 透明 性 

分 布 式 系统 的 每 个 站 点 (或 结 点 ) 都 有 可 能 会 遇 到 集中 式 系统 会 遇 到 的 故障 (错误 的 数据 、 
磁头 损坏 等 等 )。 而 且 ， 还 要 考虑 通信 链 故障 (或 消息 丢失 ) 的 风险 。 为 了 保证 系统 的 健壮 性 ， 
就 必须 能 够 检测 故障 、 重 新 配置 系统 使 得 计算 可 以 继续 进行 ， 并且 在 修复 处 理 器 或 通信 和 链 路 后 
复原 。 

错误 检测 和 系统 重新 配置 可 能 是 通信 控制 器 或 处 理 器 而 非 DBMS 的 功能 。 然 而 ， 分 布 式 
DBMS 在 出 现 故 障 时 负责 数据 库 恢 复 。 每 个 站 点 的 分 布 式 DBMS 都 具有 一 个 称 为 事务 管理 器 
(transaction manager) 的 组 件 ， 它 执行 下 列 功能 : 

1) 维持 一 个 事务 和 数据 库 前 象 、 后 象 的 日 志 。 

2) 维持 适当 的 并 发 性 控制 模式 ， 以 确保 该 站 点 的 事务 并 行 执行 时 的 数据 完整 性 。 

对 于 全 局 事务 ， 每 个 参与 站 点 中 的 事务 管理 器 相互 协调 ， 以 确保 更 新 操作 间 步 。 没 有 这 样 
的 协调 ， 在 出 现 故 障 时 就 可 能 会 丢失 数据 完整 性 。 为 了 解释 这 个 工作 过 程 ， 假 设 (与 早先 一 样 ) 
纽约 的 经 理想 要 改变 Standard Price List 文 件 中 某 个 零件 单价 (参见 图 13-9)。 这 个 事务 是 全 局 
的 ， 因 为 必须 更 新 (三 个 站 点 上 ) 该 零件 记录 的 每 份 拷贝 。 假 设 在 纽约 和 Tulsa 已 经 成 功 地 更 
新 了 单价 表 记 录 。 然 而 ， 由 于 传输 故障 ，San Mateo 的 单价 表 记 录 未 被 更 新 。 现 在 ， 这 个 零件 
的 数据 记录 是 不 一 致 的 ， 员 工 有 可 能 会 存 取 到 不 正确 的 零件 单价 。 

利用 故障 透明 性 (failure transparency )， 要 么 一 个 事务 的 所 有 操作 都 被 提交 ， 要 么 这 些 操 
作 都 不 提交 。 一 旦 发 生 某 个 事务 ， 则 其 影响 远 其 于 硬件 与 软件 故障 。 在 供 货 商 例子 里 ， 当 一 个 
站 点 的 事务 失败 ， 则 该 事务 的 结果 不 会 提交 给 其 他 站 点 。 因 此 ， 直 到 该 事务 成 功 地 完成 之 前 ， 
所 有 的 站 点 始终 保持 着 供 货 商 旧 的 标 称 值 。 
13.4.4 提交 协议 

为 了 确保 实时 、 分 布 式 更 新 操作 的 数据 完整 性 ， 需 要 协调 事务 管理 器 执行 一 个 提交 协议 
(commit protocol) ， 这 是 一 个 定义 完好 的 过 程 (涉及 消息 的 交换 )， 以 确保 全 局 事务 要 么 在 每 
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个 站 点 都 成 功 地 完成 ， 要么 中 止 。 使 用 最 广泛 的 协议 称 为 两 阶段 提交 (two-phase commit)。 一 
个 两 阶段 提交 协议 确保 多 个 站 点 上 的 并 发 事务 在 处 理 时 就 像 是 在 所 有 站 点 上 按 相 同 的 串 行 顺序 
执行 的 。 一 个 两 阶段 提交 有 点 像 在 许多 人 之 间 安 排 一 次 会 议 。 首 先 ， 发 出 该 全 局 事务 的 站 点 或 
者 某 个 总 体 协 调 站 点 (就 像 是 安排 会 议 日 程 的 人 员 )， 将 向 参与 部 分 事务 处 理 的 每 个 站 点 发 送 
一 个 请 求 。 在 安排 会 议 时 ， 其 消息 可 以 是 “在 某 个 日 期 或 时 间 ， 您 是 否 有 空 ””。 每 个 站 点 都 
处 理 其 子 事务 (倘若 可 能 的 话 )， 但 不 立即 把 结果 提交 (或 存储 到 ) 本 地 数据 库 。 相 反 ， 是 把 
结果 存储 到 某 个 临时 性 文件 里 。 若 以 开会 作 比 喻 ， 就 是 每 个 人 都 用 笔 在 其 日 历 上 写 下 了 会 议 安 
排 。 然 而 ， 每 个 站 点 都 锁定 了 (禁止 其 他 更 新 ) 其 将 要 更 新 的 那 部 分 数据 库 (就 像 每 个 人 都 不 
会 在 预定 的 会 议 时 间 里 安排 其 他 约会 ) 。 每 个 站 点 在 其 完成 子 事务 时 就 会 给 发 端 站 点 发 送 通知 。 
一 旦 所 有 的 站 点 都 响应 后 ， 发 端 站 点 便 启 动 两 阶段 提交 协议 : 

1) 向 每 个 参与 站 点 广播 一 个 消息 ， 询 问 该 站 点 是 否 要 提交 其 站 点 所 处 理 的 那 部 分 事务 。 每 
个 站 点 回复 “OK” 或 “Not OK” 消 息 。 这 就 像 每 个 人 回复 能 或 不 能 出 席 会 议 。 这 个 阶段 通常 
称 为 预备 阶段 . “OK” 代表 该 远程 站 点 答应 允许 发 出 的 请 求 在 此 远程 数据 库 上 管理 事务 。 

2) 发 端 站 点 收集 所 有 站 点 的 消息 。 如 果 全 部 都 是 “OK”， 就 向 所 有 站 点 广播 一 个 消息 ， 让 
它们 提交 各 站 点 处 理 的 事务 部 分 。 如 果 有 一 个 或 多 个 站 点 响应 的 是 “Not OK”， 它 就 向 所 有 的 
站 点 广播 一 个 消息 ， 以 中 止 该 事务 。 这 个 阶段 通常 称 为 提交 阶段 。 这 就 像 会 议 安排 者 会 根据 每 
个 人 的 同 答 来 决定 召开 或 取消 会 议 计划 。 也 有 这 种 可 能 ， 即 虽然 预备 阶段 顺利 通过 ， 但 在 提交 
阶段 ( 即 在 远程 站 点 的 提交 之 间 ) 却 出 现 事 务 失 败 ， 此 时 ， 称 该 事务 为 被 废弃 。 一 个 废弃 事务 
可 以 利用 超时 或 轮 询 来 加 以 识别 。 利 用 超时 (在 规定 的 时 间 内 没有 确认 提交 ) 无 法 区 别 是 忙碌 
还 是 故障 站 点 ， 而 轮 询 则 在 网 络 负载 和 处 理 时 间 方 面 代价 较 高 。 

上 面 只 对 两 阶段 提交 协议 进行 了 简单 描述 。 欲 知 其 更 详细 的 讨论 和 其 他 的 协议 ， 请 参见 
Date(1995) 。 

对 于 分 布 式 数据 的 同步 化 ， 采 用 两 阶段 提交 策略 ， 提 交 事 务 要 比 发 端的 位 置 能 够 单独 工作 
的 情况 慢 一 些 。 两 阶段 提交 这 一 传统 方法 的 最 新 改进 是 ， 致 力 于 降低 由 这 一 方法 固有 的 过 多 协 
调 所 引起 的 延迟 。 目 前 已 经 开发 了 三 种 改进 策略 ( 见 McGovern,1993): 

“只 读 提交 优化 这 一 方法 识别 出 事务 中 的 只 读 部 分 ,并 消去 对 这 些 部 分 的 确认 消息 之 要 求 。 

例如 ， 某 个 事务 可 能 包含 在 输入 新 订单 之 前 的 检查 库存 余额 的 要 求 。 在 事务 边界 内 读 取 


库存 余额 可 以 无 须 回复 确认 。 
* 惰性 提交 优化 这 一 方法 允许 能 够 更 新 的 站 点 先行 更 新 ， 而 其 他 不 能 立即 更 新 的 站 点 可 以 
以 后 再 “更 新 ”。 


“线性 提交 优化 这 一 方法 使 事务 的 每 个 部 分 依次 提交 ， 而 不 是 在 处 理 的 子 事务 被 延迟 时 挂 
起 整个 事务 。 
13.4.5 并 发 透明 性 

在 第 12 音 已 经 深入 讨论 过 一 个 (集中 型 ) 数据 库 的 并 发 性 控制 问题 。 当 多 个 用 户 访问 或 者 
更 新 一 个 数据 库 时 ， 除 非 采用 加 锁 机 制 来 防止 数据 受到 并 发 性 更 新 的 影响 ， 否 则 就 有 可 能 委 失 
数据 完整 性 。 在 分 布 式 数据 库 中 ， 并 发 性 控制 问题 比较 复杂 ， 因 为 多 个 用 户 分 布 于 多 个 站 点 之 
间 ， 而 且 数据 通常 又 是 复制 到 许多 站 点 的 。 

并 发 性 管理 的 目标 很 容易 定义 ， 但 实际 上 却 往往 难以 实现 。 虽 然 分 布 式 系统 并 发 运行 许多 
事务 ， 但 并 发 透明 性 (concurrency transparency ) 却 使 每 个 事务 就 像 系 统 中 的 惟一 活动 那样 处 
理 。 因 此 ， 当 几 个 事务 并 发 地 处 理 时 ， 其 结果 必须 与 每 个 事务 以 串 行 顺序 处 理 的 结果 相同 。 

必须 协调 每 个 站 点 上 的 〈 前 面 介 绍 的 ) 事务 管理 器 ， 以 提供 分 布 式 数据 库 的 并 发 性 控制 。 
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可 以 采用 三 种 基本 方法 : 加 锁 、 版 本 设置 以 及 盖 村 间 惟 ， 前 面 两 种 方法 在 第 12 章 讨论 数据 库 环 
弹 中 的 并 发 性 控制 方法 时 介绍 过 。 在 Date(1995) 里 讨论 了 分 布 式 数据 库 中 关于 加 锁 的 一 些 特 殊 
方面 。 下 面 将 讨论 盖 时 间 戳 方法 。 

盖 时 间 稚 

采用 这 一 方法 ， 每 个 事务 都 会 拥有 一 个 全 局 惟一 的 时 间 蕉 ， 它 一 般 由 该 事务 发 生 时 的 系统 
时 钟 时 间 和 站 点 耳 所 组 成 。 盖 时 间 发 (stamping ) 可 以 确保 两 个 事件 即便 同时 在 不 同 的 站 点 发 
生 ， 它 们 都 仍然 具有 惟一 的 时 间 戳 。 

疹 时 间 惟 的 目标 是 确保 事务 按 串 行 顺 序 处 理 ， 从 而 避免 使 用 锁 (因此 也 避免 了 产生 死 锁 的 
可 能 性 )。 数 据 库 里 的 每 一 条 记录 都 载 有 最 近 一 次 更 新 它 的 事务 的 时 间 戳 。 如 果 基 个 新 事务 试 
图 更 新 该 记录 ， 而 它 的 时 间 截 比 该 记录 上 载 有 的 时 间 稚 还 早 ， 则 该 事务 就 需要 分 配 一 个 新 的 时 
间 改 并 重新 启动 。 因 为 一 个 事务 不 可 能 对 时 间 发 比 它 晚 的 记录 进行 处 理 ， 所 以 它 不 可 能 去 干涉 
其 他 的 事务 。 

为 了 说 明 盖 时 间 蕉 ， 假 设 某 个 数据 库 记录 载 有 时 间 截 168， 这 表示 带 时 间 蕉 168 的 事务 是 最 
近 成 功 地 更 新 过 该 记录 的 事务 。 某 个 带 时 间 戳 170 的 新 事务 试图 更 新 这 个 记录 。 这 个 更 新 是 允 
许 的 ， 因 为 事务 的 时 间 蕉 比 记录 的 当前 时 间 翼 更 晚 。 当 更 新 被 提交 时 ， 记 录 的 时 间 改 将 重新 设 
置 成 170。 现 在 假设 时 间 惟 为 165 的 记录 试图 更 新 该 记录 。 这 一 更 新 是 不 允许 的 ， 因 为 它 的 时 间 
规 比 该 记录 所 载 有 的 时 间 蕉 还 早 。 相 反 地 ， 该 事务 时 间 惟 将 重新 设置 成 记录 所 载 有 的 168 ， 并 
日 重 新 再 启动 该 事务 。 

旋 时 间 蕉 的 主要 好 处 是 避免 了 加 锁 和 死 锁 检 测 (以 及 相关 开销 )。 主 要 缺点 是 该 方法 过 于 
保守 ， 即 使 在 与 其 他 事务 没有 任何 冲突 的 时 候 ， 事 务 有 时 也 会 重新 启动 。 

13.4.6 查询 优化 

采用 分 布 式 数据 库 ， 对 于 查询 的 响应 可 能 要 求 DBMS 组 合 来 自 几 个 不 同 站 点 的 数据 (虽然 
具备 位 置 透明 性 ， 用 户 不 必 操 心 这 些 要 求 )。DBMS 的 主要 决策 是 如 何 处 理 查 询 ， 这 既 受 到 用 
户 编写 查询 的 方式 的 影响 , 又 受到 分 布 式 DBMS 开 发 处 理 查 询 的 敏感 计划 的 智能 化 程度 的 影响 。 
Date(1983) 为 这 个 和 问题 提出 了 一 个 既 明确 又 简单 的 例子 。 考 虑 摘自 Date 的 下 列 情景 。 一 个 简化 
的 采购 (关系 ) 数据 库 具 有 下 列 三 个 关系 : 

SUPPLIER(SUPPLIER NUMBER,CITY) 10 000 条 记 半 ,存放 不 Detroit 

PART(PART NUMBER ,COLOR) 100 000 条 记录 ， 存 放任 Chicago 

SHIPMENT{SUPPLIER_NUMBER, PART_NUMBER) 1 000 000 条 记 菜 ， 存 放 存 Detroit 


下 面 是 用 SQL 编写 的 一 个 查询 ， 以 列 出 红色 零件 的 Cleveland 供 货 商 的 供 货 商 编号 : 
SELECT SUPPLIER .SUPPLIER_NUMBER 
FROM SUPPLIER, SHIPMENT, PART 
WHERE SUPPLIER.CITY='Cleveland' 
AND SHIPMENT .PART NUMBER=PART. PART_ NUMBER 
AND PART .COLOR= ' Red ' ; 


每 个 关系 中 的 每 条 记录 长 100 个 字符 ， 有 10 个 红色 零件 ，Cleveland 的 送 货 记 录 有 100 000 次 ， 
查询 的 计算 时 间 与 通信 时 间 相 比 可 以 忽略 不 计 。 而且， 通信 系统 的 传输 速率 为 10 000 字 符 / 秒 ， 
消息 从 一 个 结 点 发 送 到 另 一 个 结 点 时 有 1 秒 钟 的 访问 延迟 。 

Date 针 对 这 种 情况 点 出 了 六 种 比较 可 行 的 查询 处 理 策略 ， 并 研究 了 与 其 相关 的 通信 时 间 。 
这 些 策略 和 时 间 在 表 13-2 中 进行 了 总 结 。 随 着 策略 的 不 同 ， 满 足 查询 所 需要 的 时 间 从 1 秒 钟 直 
到 2.3 天 ! 虽然 最 后 的 策略 是 最 好 的 ， 但 第 四 种 策略 也 是 可 以 接受 的 。 
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表 13-2 分 布 式 数据 库 环 境 下 的 查询 处 理 策略 (摘自 Date.1983) 





方 法 时 间 
把 PART 关系 移 到 Detroit、 整 个 查询 在 Detroit 计 算 机 | 上 |: 处 理 16.7 分 钟 
把 SUPPLIER 和 SHIPMENT 关 系 移 到 Chicago， 整 个 查询 人 Chicago 计 算 机 上 处 理 28 小 时 
在 Detroit 计 算 机 上 连接 SUPPLIER 和 SHIPMENT， 和 将 其 投影 公 供 货 商 为 Cleveland 的 元 组 上 上、 2.3 大 


然后 作 Chicago 计 算 机 上 逐个 检查 确定 相应 的 PART 是 盏 为 红色 
在 Chicago 计 算 机 上 上 投影 PART 到 红色 零件 ， 谋 在 Detroit 计 算 机 上 上 逐个 检查 找 出 与 该 PART 相应 的 20 和 砂 
SHIPMENT 和 SUPPLIER 为 Cleveland 者 


在 Detroit 计 算 机 上 连接 SUPPLIER 和 SHIPMENT， 仅 对 SUPPLIER 为 Cleveland 者 投影 SUPPLIER_ 16.7 分 钟 
NUMBER 和 PART_NUMBER ， 和 理 将 匹配 的 投影 移 到 Chicago 计 算 机 上 以 匹配 红色 PART 
作 Chicagoi 算 机 选择 红色 PART、 将 结果 移 到 Detroit 计 算 机 匹配 SUPPLIER 为 Cleveland 者 1 秒 


一 般 来 说 ， 这 个 例子 表明 通常 建议 将 分 布 式 数据 库 环 境 中 的 查询 分 解 成 由 不 同 的 站 点 隔离 
开 来 的 片段 ， 然 后 确定 哪个 站 点 最 能 产生 最 少 的 符合 条 件 的 记录 ， 再 将 此 结果 移 到 其 他 站 点 ， 
以 完成 另外 的 工作 。 显 然 ， 两 个 以 上 站 点 需要 更 复杂 的 分 析 和 更 复杂 的 探索 来 指导 查询 处 理 。 

分 布 式 DBMS 通 常 采用 下 列 汪 个 步骤 开发 查询 处 理 计划 ( 见 Ozsu&Valduriez,1992 ): 

1) 查询 分 解 此 上 时 ， 查 询 被 简化 ， 并 改写 成 一 种 结构 化 的 关系 代数 的 形式 。 

2) 数据 本 地 化 此 时 ， 查 询 从 原来 以 数据 库 处 在 一 个 位 置 上 ， 而 查询 参照 网 络 上 的 数据 ， 
变换 成 一 个 或 多 个 片段 ， 其 中 每 一 个 片段 只 参照 一 个 站 点 的 数据 。 

3) 全 局 优化 最 后 一 步 ， 决 定 执 行 查询 片段 的 顺序 ， 数 据 如 何在 站 点 之 间 移 动 ， 以 及 执行 
查询 的 哪些 部 分 。 

可 以 肯定 ， 数 据 库 的 设计 与 分 布 式 DBMS 的 复杂 性 会 影响 查询 的 性 能 。 设 计 分 布 式 数据 库 
要 取决 于 数据 是 在 何 处 及 如 何 使 用 。 然 而 ， 对 于 给 定 的 数据 库 设 计 ( 它 将 数据 分 配 到 -- 个 或 多 
个 站 点 )， 所 有 的 查询 (无 论 期 望 与 否 ) 都 必须 尽 可 能 有 效 地 进行 处 理 。 

有 一 种 更 加 有 效 地 处 理 分 布 式 查 询 的 技术 ， 称 之 为 半 联 结 (semijoin ) 操作 ( 见 Elmasri 和 . 
Navathe 1989)。 在 半 联 结 里 ， 仅 将 正在 连接 的 属性 从 一 个 站 点 移动 到 另 一 个 站 点 ， 然 后 仅 返 回 
所 要 求 的 行 。 如 果 参 与 联结 的 仅 是 很 少 一 部 分 行 ， 那 么 需要 传输 的 数据 量 是 极 少 的 。 























站 点 1 站 点 2 

Customer 表 Order 表 
Cust_No 10 字 节 Order_No 10 字 和 节 
Cust_Name 50 字 第 Cust_No 10 字 夺 
Zip_Code 10 生 他 Order_Date 4 字 节 
SIC 5 字 克 Order_Amount 6 条 节 

10 000 行 400 000 行 








图 13-11 分 布 式 数据 库 ， 两 站 点 各 -- 个 表 


例如 ， 考 虑 图 13-11 所 示 的 分 布 式 数据 库 。 假 设 站 点 1 的 查询 要 求 显 示 在 某 个 特定 的 
Zip_Code 范 围 而 且 Order_Amount 超 过 给 定 界限 的 所 有 顾客 的 Cust_Name、 SIC 和 Order_Date 。 
假设 处 于 该 Zip_Code 范 围 内 有 10% 的 顾客 ， 而 有 2% 的 订单 超过 给 定 界 限 ， 则 可 以 构造 以 下 半 
联结 : 

1) 在 站 点 1 执行 一 个 查询 ， 以 创建 处 于 预期 的 Zip_Code 范 围 内 的 Cust_No 值 列表 。 故 有 
10 000 顾 客 x 0.1， 即 1000 行 满足 该 Zip_Code 限 制 条 件 。 因 此 ， 需要 发 送 到 站 点 2 的 有 1000 行 
Cust_No 属 性 (连接 中 属性 )， 每 行 10 字 节 ， 共 10 000 字 节 。 
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2) 在 站 点 2 执行 -- 个 查询 ， 以 创建 Cust_ No 和 Order_Date 的 值 列 表 发 回 站 点 1， 从 而 形成 最 
后 的 结果 。 如 果 我 们 假设 每 个 顾客 都 有 相同 数量 的 订单 ， 则 与 从 站 点 1 发 来 的 顾客 数 相对 应 的 
Order 表 约 为 40 000 行 。 如 果 假 设 每 个 顾客 的 订单 在 限 值 以 上 的 同样 多 ， 则 该 查询 涉及 的 Order 
表 行 数 为 800(40 000 x 0.02)。 对 于 每 一 行 ，Cust_No 和 Order_Date 需 要 发 到 站 点 1， 即 14 字 闻 x 
800 行 ， 共 11 200 字 节 。 

采用 上 述 的 半 联 结 ， 需 要 传输 的 数据 总 量 仅 有 21 200 字 节 。 我 们 把 这 个 总 量 和 从 一 个 站 点 
到 另 一 个 站 点 所 需要 的 每 个 表 的 子 集 作 一 个 比较 : 

。 对 于 从 站 点 1 到 站 点 2 的 数据 发 送 ， 需 要 发 送 占 Customer 表 1000 行 的 Cust_No、Cust_Name 

和 SIC (65 字 节 1000 行 共 65 000 字 节 ) 发 往 站 点 2。 

*。 对 于 从 站 点 2 到 站 点 1 的 数据 发 送 ， 需 要 发 送 占 Order 表 8000 行 的 Cust_No 和 Order_Date 

(14 字 节 ，8000 行 共 112 000 字 节 ) 发 往 站 点 1。 
显然 ， 半 连接 方法 减少 了 网 络 流量 ， 这 是 响应 用 户 查 询 的 总 体 时 间 的 主要 因素 。 

分 布 式 DBMS 采 用 一 个 成 本 模型 来 预测 可 选 执行 计划 的 执行 时 间 (数据 处 理 和 传输 )。 成 
本 模型 是 根据 一 般 网 络 条 件 在 执行 查询 之 前 完成 的 ; 因而 实际 成 本 可 能 会 有 所 偏差 ， 这 取决 于 
实际 的 网 络 与 结 点 负载 、 数 据 库 重 构 以 及 其 他 动态 因素 。 因 此 ， 随 着 网 络 中 一 般 条 件 (比如 本 
地 数据 库 的 重新 设计 、 网 络 路 径 的 变更 以 及 本 地 站 点 DBMS 的 替换 等 ) 的 改变 ， 成 本 模型 的 参 
数 应 当 定期 地 加 以 更 新 。 

13.4.7 ”分布 式 DBMS 的 发 展 

分 布 式 数据 库 管理 仍然 是 一 门 新 兴 的 而 非 已 成 熟 的 技术 。 目 前 发 布 的 分 布 式 DBMS 产 品 
没有 提供 前 面 各 节 所 描述 的 全 部 特性 。 例 如 ， 有 些 产 品 为 只 读 事务 提供 位 置 透明 性 ， 但 不 能 支 
持 全 局 更 新 。 为 了 描述 分 布 式 DBMS 产 品 的 发 展 ， 我 们 简单 地 把 这 一 发 展 过 程 分 割 为 三 个 阶段 : 
远程 作业 单位 、 分 布 式 作业 单位 和 分 布 式 请 求 。 然 后 ， 在 下 一 节 里 再 归纳 主流 分 布 式 DBMS 
(在 编写 本 书 时 出 现 的 这 些 软 件 包 ) 的 主要 特点 。 

在 下 面 的 讨论 里 ， 术 语 作业 单位 指 处 理事 务 所 需要 的 一 系列 指令 ， 即 从 “开始 事务 ”操作 
开始 ， 直 到 “提交 ”或 “ 回 滚 ”操作 为 止 的 指令 集合 。 

1. 远程 作业 单位 

第 一 阶段 允许 在 一 个 位 置 上 发 出 多 条 SQL 语句 ， 并 使 其 像 是 在 一 个 远程 DBMS 上 的 一 个 作 
业 单位 那样 执行 。 无 论 发 送 端 还 是 接收 端 计算 机 ， 都 必须 运行 相同 的 DBMS。 发 送 端 计算 机 并 
不 需要 访问 数据 目录 来 定位 包含 远程 作业 单位 的 选 定 表 的 站 点 。 相 反 ， 发 送 端的 应 用 软件 必须 
先知 道 数 据 驻 留 的 位 置 ， 并 在 连接 到 远程 作业 单位 之 前 先 与 远程 DBMS 相 连 。 因 此 ， 远 程 作业 
单位 概念 并 不 支持 位 置 透明 性 。 

一 个 远程 作业 单位 (也 称 为 远程 事务 ) 允许 在 一 个 远程 计算 机 上 进行 更 新 。 在 作业 单位 内 
的 所 有 更 新 都 是 尝试 性 的 ， 直 到 对 它们 作出 提交 使 其 变 成 永久 性 的 ， 或 者 回 滚 撤销 它们 为 止 。 
因此 ， 要 为 远程 站 点 维护 事务 完整 性 的 。 然 而 ， 当 操作 涉及 多 个 远程 位 置 时 ， 事 务 完整 性 就 不 
能 得 到 保证 。 参 考 图 13-9 的 数据 库 ，San Mateo 的 应 用 软件 可 以 更 新 Tulsa 的 Part 文 件 ， 并 保持 事 
务 完整 性 。 但 是 ， 应 用 软件 不 能 同时 更 新 两 个 以 上 位 置 上 的 Part 文 件 ， 却 仍然 可 以 维持 事务 完 
整 性 。 因 此 ， 远 程 作业 单位 也 不 提供 故障 透明 性 。 

2. 分 布 式 作业 单位 

分 布 式 作 业 单 位 允许 作业 单位 内 的 各 个 语句 引用 多 个 远程 DBMS 。 这 个 方法 支持 一 定 程度 
上 的 位 置 透明 性 ， 因 为 它 能 访问 数据 目录 ， 对 包含 每 个 语句 中 选择 表 的 DBMS 进 行 定位 。 但 是 ， 
在 一 个 SQL 语句 里 的 所 有 表 都 必须 处 于 同一 个 位 置 。 因 此 ， 计 划 用 来 组 合 图 13-9 所 示 的 三 个 站 
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点 的 零件 信息 的 下 列 查询 ， 是 不 能 用 于 远程 作业 单位 的 : 


SELECT DISTINCT PART NUMBER,PART NAME 
FROM PART 

WHERE COLOR= ' ORANGE ' 

ORDER BY PART_ NUMBER 


类 似 地 ， 分 布 式 作 业 单 位 也 不 允许 用 一 条 SQL 语句 更 新 多 个 位 置 上 的 数据 。 例 如 ， 下 列 SQL 语 
句 打算 更 新 三 个 位 置 上 的 Part 文 件 : 


UPDATE PART 
SET UNIT PRICE=]127.49 
WHERE PART NUMBER=12345 


这 一 更 新 (倘若 执行 的 话 ) 将 会 在 Tulsa、San Mateo 和 New York (参见 图 13-9) 设置 零件 号 
12345 的 单价 为 $127.49。 然 而 ， 这 个 语句 是 不 能 作为 分 布 式 作业 单位 的 ， 因 为 该 SQL 语句 要 引 
用 多 个 位 置 上 的 数据 。 分 布 式 作 业 单 位 能 支持 涉及 多 个 站 点 的 受 保护 的 更 新 ， 只 要 每 个 SQL 语 
名 引用 的 仅 是 一 个 站 点 上 的 一 个 (或 多 个 ) 表 即 可 。 例 如 ， 在 图 13-9 中 ， 假 设 我 们 需要 增加 
Tulsa 的 零件 号 为 12345 的 库存 量 , 同时 减少 在 纽约 的 同 种 零件 的 库存 量 (可 以 反映 库存 的 调整 )。 
此 时 可 以 采用 下 列 SQL 语 句 : 


UPDATE PART 

SET BALANCE=BALANCE-50 

WHERE PART NUMBER=12345 AND LOCRATION= 'TULSRA 
UPDATE PART 

SET BALANCE=BALANCE+50 

WHERE PART NUMBER=12345 AND LOCATION='NEW YORK'; 


任 分 布 式 作业 单位 概念 下 ， 要 么 这 个 更 新 在 两 个 位 置 都 提交 了 ， 要 么 它 回 滚 并 (或许) 重 
新 尝试 。 从 这 个 例子 可 以 看 出 ， 分 布 式 作 业 单 位 在 一 定 程度 上 支持 本 节 前 面 所 讨论 的 透明 性 。 

3. 分 布 式 请 求 

分 布 式 请 求 克 服 了 分 布 式 作 业 单位 的 主要 限制 ， 它 允许 一 条 SQL 语 句 引用 多 个 远程 DBMS 


布 式 请 求 可 以 (或 不 可 以 ) 支持 复制 透明 性 和 故障 透明 性 。 有 可 能 在 真正 的 分 布 式 DBMS 之 前 
的 某 个 时 刻 ， 市 场 上 会 出 现 支持 前 面 所 描述 的 所 有 透明 性 的 产品 。 


13.5 分 布 式 数据 库 管 理 系统 产品 


数据 库 管 理 系统 的 绝 大 多 数 主要 供 货 商 都 有 分 布 式 版 本 产品 。 在 大 多 数 情况 下 ， 为 了 尽量 
利用 分 布 式 数据 库 的 功能 ， 必 须 在 每 个 结 点 上 运行 同一 个 供 货 商 的 DBMS ( 同 构 分 布 式 数据 库 
环境 )。 客 户 /服务 器 形式 的 分 布 式 数据 库 虽 有 争议 ， 但 实际 上 却 是 今天 最 普遍 的 形式 。 在 客户 
服务 器 环境 里 (参见 第 9 章 关 于 客户 /服务 器 数据 库 的 六 述 )， 很 容易 在 局 域 网 或 广域网 的 多 个 
结 点 上 定义 具有 表 的 数据 库 。 一 旦 用 户 程序 确立 了 与 每 个 远程 站 点 的 链接 ， 并 装载 好 适当 的 数 
据 库 中 间 件 ， 就 可 以 达到 完全 的 位 置 透明 性 。 所 以 ， 在 客户 /服务 器 数据 库 中 ， 分 布 式 数据 库 
(其 至 异 构 DBMS) 都 是 很 容易 用 于 任何 信息 系统 开发 者 。 

尽管 它们 的 实现 方法 在 不 断 改变 ， 但 还 是 可 以 概述 一 下 不 同 的 供 货 商 是 如 何 解决 分 布 式 数 
据 库 管理 的 。 用 户 最 感 兴趣 的 方面 是 产品 之 间 的 差异 。 这 些 差异 (归纳 在 表 13-3 里 ) 说 明了 选 
择 分 布 式 DBMS 产 品 的 难度 ， 因 为 DBMS 的 确切 功能 必须 与 组 织 的 需求 尽 可 能 匹配 。 此 外 ， 婚 
有 如 此 多 的 可 选项 ， 每 个 产品 处 理 的 分 布 式 数据 又 各 不 相同 ， 因 此 ， 几 平 不 可 能 列举 出 管理 分 
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布 式 数 据 库 的 一 般 原理 。 在 进行 任何 分 布 式 数据 库 的 设计 时 都 要 求 仔细 地 分 析 业 务 的 需求 和 
DBMS 的 复杂 性 。Thompson(1997) 也 建议 ， 应 当 只 在 真正 需要 分 布 式 DBMS 的 地 方才 采用 分 布 
式 DBMS 产 品 。 不 要 用 分 布 式 DBMS 来 为 以 任务 关键 的 应 用 软件 创建 备份 数据 库 ; 对 于 简单 需 
求 则 有 比较 简单 的 解决 办 法 ， 比 如 RAID( 见 第 6 章 )。 

表 13-3 分 布 式 DBMS 





供 货 商 产 站 重 要 特性 
IBM DataPropagator Relational 。tjDB2. -起 工作 
(DPropR) 。 主 站 点 和 异步 更 新 


“只 读 站 点 订阅 主 站 点 

“订阅 子 集 与 在 询 结果 
Distributed Relational * 异 构 数 据 库 
Database Architecture 


(DRDA) 
DataJoiner 。 访 问 非 iBM 数 据 库 的 中 间 件 
Sybase Replication Server “二 站 点 和 分 布 式 只 污 站 点 


“只 读 站 点 更 新 为 一 个 事务 
“层次 型 复制 
“复制 数据 和 存储 过 程 


SQL Anywhere * 可 移动 数据 库 
OmniSQL 。 异 构 数据 库 
Oracle Table Snapshot Option “周期 性 快照 发 往 只 污 站 点 





“ 带 多 重 可 更 新 拷贝 的 异步 、 同 步 和 从 某 个 结 点 到 其 
他 任何 结 点 的 复制 (双向 ) 

*。 微分 刷新 

*。DBA 控 制 复制 

* 时 阶段 提交 

“可 更 新 所 有 的 数据 库 拷贝 

。 层 次 型 复制 

“DBA 寄 存 复制 数据 和 其 他 站 点 的 数据 

。 主 /从 形式 允许 从 属于 Ingres 数 据 库 

“将 查询 分 解 色 分 布 的 、 同 构 的 站 点 

“也 可 用 了 于 非 Ingres 数 据 库 

。 主 站 点 和 分 布 式 只 污 站 点 

“公布 和 订阅 文章 、 出 版 物 

“一 个 数据 库 能 够 把 发 布 的 拷贝 送 往 其 他 站 点 

“可 移动 数据 库 

一 


本 章 小 结 


本 章 介 绍 了 有 关 分 布 式 数据 库 的 各 种 问题 与 技术 。 我 们 已 经 看 到 分 布 式 数据 库 是 遍布 于 多 

个 位 置 的 计算 机 上 ， 并 通过 一 个 数据 通信 和 网络 连接 起 来 的 单个 逻辑 数据 库 。 分 布 式 数据 库 与 分 
散 型 数据 库 不 同 ， 分 散 型 数据 库 中 的 数据 并 没有 互相 连接 。 在 分 布 式 数据 库 中 ， 其 网 络 必须 多 
许 用 户 尽 可 能 透明 地 共享 数据 ， 还 必须 允许 每 个 结 点 自治 地 运作 ， 在 网 络 链接 断 开 或 者 某 个 结 
点 出 故障 时 ， 这 一 点 尤其 重要 。 当 前 的 业务 环境 鼓励 用 户 采用 分 布 式 数据 库 ， 这 些 业务 环境 包 
括 业 务 单位 的 分 散 化 与 自治 (包括 组 织 的 金 球 化 )、 数 据 共享 的 需求 以 及 数据 通信 的 成 本 与 可 千 
性 等 等 。 分 布 式 数据 库 环境 可 以 是 同 构 的 ， 即 每 个 结 点 都 使 用 相同 的 DBMS; 也 可 以 是 异 构 的 ， 


Symmetric Replication option 


Computer CA-Ingres/Replicator 


Associates 


Ingres/Net 和 Ingres/Star 


Microsoft SQL Server 
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即 不 同 的 结 点 可 以 使 用 不 同 的 DBMS。 此 外 ，-- 个 分 布 式 数据 库 可 以 用 直接 同步 方式 保存 数据 
与 相关 数据 的 全 部 拷贝 ， 也 可 以 容忍 采用 异步 方法 进行 数据 更 新 所 带 来 的 预料 中 的 延迟 。 

分 布 式 数据 库 有 诸多 优势 。 最 重要 的 优势 包括 : 提高 数据 的 可 靠 性 与 可 用 性 、 用 户 对 其 数 
据 的 本 地 控制 、 模 块 式 (或 增 量 式 ) 增长 、 减 少 通信 成 本 以 及 快速 响应 数据 请 求 。 分 布 式 数据 
库 也 会 带 来 一 些 开销 与 不 利 因素 ， 其 中 包括 软件 成 本 较 高 且 复 杂 、 处 理 开销 增加 、 维 护 数据 完 
整 性 更 为 困难 ， 而 且 倘若 数据 分 布 得 不 当 ， 对 于 数据 请 求 的 响应 可 能 会 很 慢 。 

在 一 个 网 络 中 分 布 数据 可 以 有 多 种 选择 :数据 复制 、 水 平分 割 、 垂 直 分 割 以 及 这 些 方法 的 
组 合 。 采 用 数据 复制 ， 每 两 个 (或 多 个 ) 站 点 就 要 保存 该 数据 库 (或 部 分 数据 库 ) 的 一 份 拷贝 
数据 复制 可 以 改善 可 靠 性 与 加 快 响应 速度 ， 在 一 定 的 场合 下 又 能 够 很 简单 地 完成 ， 它 允许 结 点 
彼此 更 独立 (当然 也 还 需要 协调 ) 地 运作 ， 从 而 减 小 了 网 络 流量 。 然 而 ， 它 需要 额外 的 存储 容量 ， 
要 在 每 个 站 点 直接 进行 更 新 比较 困难 。 复 制 后 的 数据 可 以 通过 对 数据 的 正式 记录 作 周 期 性 快照 ， 
诈 把 快照 发 送 到 复制 站 点 进行 更 新 。 这 些 快照 可 以 包含 所 有 的 数据 ， 也 可 以 仅仅 包含 自 最 近 一 
次 快照 以 来 有 变化 的 数据 。 采 用 水 平分 割 时 ， 一 个 联系 的 某 些 行 放 在 某 个 站 点 里 、 而 别 的 行 则 
放 在 另 一 个 (或 者 几 个 ) 站 点 里 。 另 一 方面 ， 重 直 分 割 则 是 在 不 同 的 站 点 分 布 一 个 联系 的 列 。 数 
据 分 割 的 日 标 是 改善 性 能 和 安全 性 ,人们 经 常 采用 把 数据 复制 与 水 平分 割 、 每 直 分 割 组 合 使 用 。 
在 选择 数据 分 布 式 设计 时 ， 主 要 考虑 的 因素 包括 ; 组 织 性 因素 、 查 询 与 事务 的 频率 与 位 置 、 数 
据 与 结 点 的 可 能 增长 、 技 术 水 平 以 及 对 可 靠 性 的 要 求 。 

有 了 分 布 式 数据 库 ， 还 必须 有 -一 个 分 布 式 DBMS 对 各 个 结 点 的 数据 访问 进行 协调 。 来 自用 
户 或 应 用 软件 的 数据 请 求 ， 首 先 由 分 布 式 DBMS 处 理 ， 以 确定 该 事务 是 本 地 事务 (可 以 由 该 站 
点 处 理 )、 远 程 事务 〈 可 以 由 某 个 别 的 站 点 处 理 ) 还 是 全 局 事务 (需要 在 几 个 非 本 地 站 点 访问 
数据 )。 对 于 全 局 事务 ， 该 分 布 式 DBMS 会 去 访问 数据 目录 ， 并 在 需要 时 传输 部 分 请 求 ， 然 后 
把 远程 站 点 的 结果 汇集 起 来 。 

一 个 分 布 式 DBMS 应 当 使 用 户 远离 分 布 式 数据 库 在 管理 上 的 复杂 性 。 位 置 透明 性 是 指 尽管 
数据 在 地 理 上 是 分 布 的 ， 但 对 用 户 来 说 仿佛 所 有 的 数据 都 处 在 一 个 结 点 上。 复制 透明 性 是 指 尽 
管 数据 项 可 能 存放 在 几 个 不 同 的 结 点 上 ， 但 用 户 可 以 把 它 当 成 是 单个 结 点 上 的 单一 数据 项 那样 
地 处 理 。 故障 透明 性 是 指 要 么 一 个 事务 的 所 有 操作 都 在 每 个 站 点 上 完成 , 要么 它们 都 不 被 提交 。 
分 布 式 数据 库 可 以 在 直接 同步 化 不 是 必要 的 时 候 允 许 结 点 之 间 有 暂时 的 不 一 致 。 并 发 透明 性 是 
指 每 个 事务 都 像 是 该 系统 里 仅 有 的 一 项 活动 。 故 障 透 明 性 和 并 发 透明 性 可 以 通过 提交 协议 来 加 
以 管理 ， 该 协议 协调 着 结 点 间 的 更 新 、 数 据 加 锁 以 及 羡 时 间 蕉 。 

由 分 布 式 DBMS 做 出 的 一 项 重要 决策 就 是 如 何 处 理 全 局 查询 。 处 理 -一 个 全 局 查询 的 时 间 可 
能 会 从 几 秒 到 几 个 小 时 ， 这 取决 于 该 DBMS 在 产生 一 个 有 效 的 查询 处 理 计划 时 的 智能 程度 。 查 
询 处 理 计划 把 该 查询 分 解 成 一 系列 结构 化 步 又 ， 这 些 步 匠 是 通过 该 分 布 式 数据 库 不同 的 结 点 的 
本 地 数据 来 确定 的 ， 并 最 终 选择 出 执行 这 些 步 县 的 顺序 与 位 置 。 

多 数 (如 果 不 是 全 部 的 话 ) 分 布 式 DBMS 产 品 都 提供 各 种 形式 的 透明 性 、 各 种 形式 的 数据 复 
制 与 分 割 ， 以 及 在 分 布 式 查 询 处 理 上 同样 级 别 的 智能 性 。 然 而 ， 由 于 分 布 式 系统 的 增长 所 形成 
的 业务 压力 ,这 些 产品 都 在 迅速 地 改善 。 关系 数据 库 产品 的 主流 供应 商 已 经 引入 了 分 布 式 版 本 ， 
以 及 帮助 数据 库 管理 员 设计 与 管理 分 布 式 数据 库 的 工具 ， 


本 章 复习 


关键 术语 
分 布 式 数据 库 分 散 型 数据 库 位 置 透明 性 
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复习 问题 





本 地 自治 同步 分 布 式 数据 库 异步 分 布 式 数据 库 
本 地 事务 全 局 事务 复制 透明 性 
事务 管理 器 故障 透明 性 提交 协议 
两 阶段 提交 并 发 透明 性 盖 时 间 戳 
半 联 结 
1. 定 义 下 列 术 语 : 
a. 分 布 式 数 据 库 b. 位 置 透明 性 
c. 两 阶段 提交 d. 全 局 事务 
e. 本 地 自治 f. 盖 时 间 惟 
g. 事务 管理 器 


[SS 


. 匹配 下 列 术语 及 其 定义 : 
复制 透明 性 a. 确保 某 个 分 布 式 数据 库 上 的 事务 或 者 全 部 更 新 ， 或 者 都 不 更 新 
一 一 作业 单位 b. 表现 为 给 定 事务 是 惟一 一 个 在 分 布 式 数据 库 上 运行 的 事务 
一 全 局 事务 c. 将 数据 拷贝 视 为 仅 有 一 个 拷贝 

一 复制 d. 引用 不 止 一 个 位 置 的 数据 

一 一 并 发 透明 性 。 “e. 处 理 某 个 事务 所 需要 的 指令 的 顺序 

一 故障 透明 性 。 f. 对 于 只 读 型 数据 的 一 种 较 好 的 数据 库 分 布 策略 
. 比较 下 列 术 语 : 

a. 分布 式 数据 库 ; 分 散 型 数据 库 b. 同 构 分 布 式 数据 库 ; 异 构 分 布 式 数据 库 


ww 


c. 位 置 透明 性 ; 本 地 自治 d. 异步 分 布 式 数据 库 ， 同 步 分 布 式 数 据 库 
e. 水 平分 割 ; 垂直 分 割 f. 发 布 ; 订阅 

g. 完全 刷新 ; 微分 刷新 h. 下 推 复制 ; 下 拉 复 制 

i, 本 地 事务 ; 全 局 事务 


4. 简要 描述 可 以 使 用 分 布 式 数据 库 的 六 个 业务 条 件 。 

5. 阐述 同 构 分 布 式 数据 库 的 两 种 类 型 。 

6. 简要 描述 同 构 分 布 式 数据 库 的 五 个 主要 特征 。 

7. 简要 描述 异 构 分 布 式 数据 库 的 四 个 主要 特征 。 

8. 简要 描述 分 布 式 数据 库 与 分 散 型 数据 库 相 比 的 五 个 优势 。 

9. 简要 描述 分 布 式 数据 库 的 四 个 开销 与 不 利之 处 。 

10. 简要 描述 分 布 式 数 据 库 数据 复制 的 五 个 好 处 。 

11. 简要 描述 分 布 式 数据 库 数据 复制 的 两 个 不 利之 处 。 

12. 出 述 最 适合 采用 快照 复制 方法 的 场合 。 

13. 阐述 最 适合 采用 接近 实时 复制 方法 的 场合 。 

14. 简要 描述 五 个 影响 数据 复制 作为 某 个 应 用 软件 分 布 式 数据 库 设计 的 策略 的 因素 。 
15. 阐述 分 布 式 数据 库 水 平分 割 的 利弊 。 

16. 阐述 分 布 式 数据 库 垂 直 分 割 的 利弊 。 

17. 简要 描述 五 个 影响 分 布 式 数据 库 设计 策略 选择 的 因素 。 

18. 简要 描述 六 个 分 布 式 数据 库 管理 系统 所 独 有 的 功能 。 

19. 简要 说 明 位 置 透明 性 对 一 个 特定 的 数据 库 查 询 的 作者 的 影响 。 
20. 简要 说 明 复制 透明 性 对 一 个 特定 的 数据 库 查 询 的 作者 的 影响 。 
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21. 简要 说 明 在 什么 场合 下 两 阶段 提交 仍然 无 法 创建 完全 一 致 的 分 布 式 数 据 库 。 
22. 简要 描述 对 于 两 阶段 提交 协议 的 三 种 改进 。 
23. 简要 摘 述 分 布 式 查询 处 理 的 三 个 步骤 。 
24. 简要 说 明 采 用 半 联 结 会 加 快 分 布 式 查询 处 理 速度 的 条 件 。 
问题 和 练习 
问题 和 练习 1 ~ 3 参考 图 13-9 所 示 的 分 布 式 数据 库 。 
i. 说 出 以 下 每 一 种 情况 所 应 用 的 透明 性 。 


[ses 
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a. New York 与 Tulsa 的 最 终 用 户 同时 要 对 San Mateo 的 Engineering Part 数 据 库 进 行 更 新 ， 
两 个 用 户 都 未 意识 到 对 方正 在 访问 数据 ， 然 而 系统 会 避免 由 于 干扰 而 造成 更 新 丢失 。 
b.Tulsa 的 最 终 用 户 有 删除 了 本 地 Standard Price List 中 的 某 数据 项 。 他 不 知道 该 分 布 式 

DBMS 还 从 San Mateo 与 New York 的 Standard Price List 中 里 删除 了 此 数据 项 。 

c. San Mateo 的 某 个 用 户 启动 一 项 事务 ， 即 删除 San Mateo 零 件 库 的 某 个 零件 ， 同 时 把 它 
追加 到 New York 零 件 库 里 去 。 该 事务 在 San Mateo 中 完成 ， 但 由 于 传输 故障 在 New 
York 没 有 完成 。 该 分 布 式 DBMS 便 自动 地 恢复 了 San Mateo 的 事务 ， 并 通知 用 户 重 试 
此 事务 。 

d. New York 的 某 个 最 终 用 户 请 求 本 地 查看 编号 为 33445 的 零件 的 库存 。 该 用 户 不 知道 此 
零件 的 记录 的 存放 位 置 。 分 布 式 DBMS 去 访问 数据 目录 ， 并 把 此 项 请 求 传 输 给 San 


Mateo 。 


.考虑 图 13-9 中 的 Standard Price List: 


a. 写 出 使 Part_Number $6789 的 Unit_Price 增 加 10% 的 SQL 语句 。 
b. 指出 上 述 语 名 在 下 列 协议 中 是 否 可 以 接受 : 
(1) 远程 作业 单位 (2) 分 布 式 作业 单位 (3) 分 布 式 请 求 


. 考虑 图 13-9 中 的 四 个 Part 数 据 库 : 


a. 写 出 将 San Mateo Part 库 中 Part_Number 56789 的 库存 增加 10% 的 SQL 语 旬 ， 以 及 将 
New York Part 库 中 Part_Number 12345 的 库存 减少 10% 的 SQL 语 句 ， 

b. 指出 上 述 语 甸 在 下 列 协议 中 是 否 可 以 接受 : 
(D 远程 作业 单位 (2) 分 布 式 作业 单位 (3) 分 布 式 请 求 


4. 说 明 为 什么 难以 实现 真正 的 异 构 分 布 式 数据 库 环境 。 此 环境 里 存在 哪些 特殊 困难 。 


5. 阐述 表 13-2 所 列 出 的 六 种 查询 处 理 策略 会 产生 截然 不 同 的 结果 的 主要 原因 。 


6. 表 13-2 所 列 的 六 种 查询 处 理 策略 中 是 否 使 用 了 半 联 结 ? 车 有 ,请 桨 述 半 联 结 是 如 何 用 的 。 
佑 设 有 ， 请 阐述 如 何 使 用 半 联 结 来 创建 有 效 的 查询 处 理 策略 ， 或 者 为 什么 在 这 种 情况 下 使 用 半 
联结 无 济 于 事 。 

7. 考虑 本 章 13.3.6 节 提 到 的 分 布 式 数据 库 和 SUPPLIER、PART 与 SHIPMENT 关 系 : 


8. 


. 写 出 全 局 SQL 查 询 (在 Chicago 提 交 )， 显 示 不 是 由 Columbus 供 应 商 提供 的 任何 零件 之 

Part_Number 和 Color。 

为 上 述 查 询 设计 三 个 可 能 的 查询 处 理 策略 。 

为 比较 上 述 三 个 策略 的 处 理 时 间 ， 开 发 一 个 与 表 13-2 类 似 的 表 。 

三 种 策略 中 哪个 最 佳 ? 为 什么 ? 

e. 能 否 利用 数据 库 的 数据 复制 、 水 平分 割 和 垂直 分 割 创建 一 种 更 加 有 效 的 查询 处 理 策 
略 ? 说 明 原 因 。 

考虑 一 家 大 型 连锁 店 的 下 述 规范 化 的 数据 库 关 系 : 


ce 9 
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SCHEDULE (Department_ID, Employee_ID, Date) 


假设 有 一 个 数据 通信 网 络 把 公司 总 部 的 计算 机 与 每 个 零售 批发 店 的 计算 机 链接 起 来 ， 连 锁 
店 中 包括 50 家 商店 ， 平 均 每 家 商店 有 75 名 员工 ， 而 每 家 商店 有 10 个 部 门 。 需 要 保存 5 个 月 〈 前 
两 个 月 、 当 月 以 及 后 两 个 月 ) 的 每 日 进度 安排 表 。 进 一 步 进行 如 下 假设 
* 每 个 商店 经 理 大 约 每 小 时 更 新 5 次 其 员工 的 工作 进度 安排 表 。 
“公司 生成 每 家 商店 每 个 员工 的 全 部 工资 表 清 单 、 员 工 通知 以 及 其 他 邮件 。 
* 公司 每 个 月 要 为 每 个 部 门 制定 新 的 销售 月 标 。 
“公司 有 权 雇用 与 解雇 各 个 商店 经 理 ， 并 控制 商店 经 理 的 全 部 信息 ， 而 商店 经 理 有 权 雇 用 
与 解雇 其 店内 的 所 有 员工 ， 并 控制 有 关 他 们 的 全 部 信息 。 
a. 你 会 为 该 连锁 商店 推荐 分 布 式 数据 库 、 分 散 型 数据 库 还 是 一 组 分 散 型 数据 库 ? 
b. 假设 决定 采用 某 种 分 布 式 数 据 库 ， 你 建议 该 连锁 店 采用 怎样 的 数据 分 布 策略 ? 
应 用 练习 
1. 参观 一 个 已 经 安装 了 分 布 式 数据 库 管理 系统 的 组 织 。 研 究 下 列 问题 : 
a. 该 组 织 是 否 拥 有 真正 的 分 布 式 数据 库 ” 若 有 , 其 数据 是 如 何 分 布 的 ? 是 采用 数据 复制 、 
水 平分 割 还 是 垂直 分 割 ? 
.采用 的 是 哪 种 商业 分 布 式 数据 库 产 品 ” 该 组 织 为 什么 选择 这 些 产品 ?该 组 织 使 用 这 些 
产品 后 ， 是 否 发 现 过 什么 问题 或 者 限制 ? 
.该 系统 是 否 提供 了 以 下 的 各 种 扩展 功能 : 





ST 
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i. 位 置 透明 性 ii. 复制 透明 性 
iii. 并 发 透明 性 iv. 故障 透明 性 
v. 查 询 优 化 
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.该 组 织 对 于 分 布 式 数据 库 未 来 的 发 展 有 何 打算 ? 
.与 该 组 织 的 数据 库 管理 员 交谈 ， 以 了 解 如 何 确定 网 络 中 数据 的 位 置 。 在 决策 中 主要 老 
虑 哪些 因素 ?有 没有 采用 过 分 析 性 工具 ? 若 有 ， 数 据 库 管理 员 是 否 满意 于 此 项 工具 对 
其 提高 查询 处 理 效率 的 帮助 ? 
2. 在 因特网 上 查找 研究 本 章 讨论 到 的 DBMS 供 应 商 提 供 的 最 新 的 分 布 式 数据 库 产 品 。 更 新 
其 中 描述 的 一 个 分 布 式 DBMS 产 品 的 特点 。 试 查找 别 的 供应 商 的 分 布 式 DBMS 产 品 并 列 出 关于 
这 些 产 品 的 信息 。 
3. 参观 某 个 安装 有 客户 /服务 器 数据 库 环境 的 组 织 。 寻 找 下 述 问 题 的 答案 : 
a. 该 客户 /服务 器 DBMS 在 使 用 时 提供 哪些 分 布 式 数据 库 特性 ? 
b. 该 组 织 是 否 尝试 达到 本 章 对 分 布 式 数据 库 所 指出 的 客户 /服务 器 环境 的 相同 好 处 ”有 
哪些 好 处 达到 了 ? 又 有 哪些 是 客户 /服务 器 技术 不 可 能 达到 的 ? 
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题 已 经 由 来 白 西 班 牙 、 意 大 利 与 新 西 兰 的 专业 人 士 所 组 成 的 组 织 进行 研究 。 
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项 目 案例 : 山 景 社区 医院 


在 第 6 章 山 景 社区 医院 的 案例 里 ， 我 们 曾 为 一 个 集中 型 数据 库 作 过 一 些 物理 数据 库 设 计 的 
决策 。 请 参照 该 部 分 的 项 目 问题 和 项 目 练习 的 答案 。 

项 目 描述 

山 景 社 区 医院 将 从 几 个 方面 进行 扩展 。 首 先 ， 医 院 将 在 Golf Estates 郊 区 开设 一 家 附属 外 科 
门诊 部 。 其 次 ， 医 院 正在 获取 社区 内 几 个 医生 团体 的 意见 ， 并 向 这 些 办 公 室 和 门诊 所 提供 所 有 
的 病历 记录 和 账单 服务 。 因 为 有 这 些 显著 变化 ， 医 院 信息 系统 的 员工 正在 考虑 采用 分 布 式 计算 
机 和 数据 库 。 

项 目 问 题 

1) 除了 第 6 章 中 制定 物理 数据 库 设计 决策 时 收集 的 信息 之 外 ， 还 需要 哪些 信息 才能 决定 山 
景 社区 医院 应 当 采 用 分 布 式 数据 库 技术 ? 

2) 除了 第 6 章 中 制定 物理 数据 库 设 计 决策 时 收集 的 信息 之 外 ， 还 需要 哪些 类 型 的 信息 ， 才 
能 决定 为 山 景 社区 医院 设计 分 布 式 数据 库 ? 

3) 是 否 有 机 会 把 分 布 式 数据 库 的 数据 复制 、 水 平分 割 和 垂直 分 割 应 用 于 山 景 社区 医院 ? 倘 
若 不 能 确定 ， 你 还 需要 哪些 信息 才能 回答 这 个 问题 ? 

项 目 练习 | 

对 于 山 景 社区 医院 来 说 , 绝 大 多 数 数据 维护 都 是 在 病人 活动 所 在 的 站 点 本 地 完成 的 。 例 如 ， 
以 第 6 章 中 图 6-13 表 示 的 数据 为 例 ，80% 以 上 的 变化 是 在 医生 办 公 室 作出 的 ，10% 是 在 医院 总 部 
作出 的 ， 还 有 10% 是 在 附属 外 科 诊 所 里 作出 的 。 而 且 ， 绝 大 多 数 查询 都 是 本 地 的 (例如 ， 医 生 
办 公 室 里 的 医生 通常 在 病人 在 其 办 公 室 时 ， 查 阅 对 此 病人 进行 过 哪些 治疗 ) 。 不 过 ， 由 于 医疗 
服务 问题 通常 要 求 快速 的 响应 ， 所 以 医生 很 关心 分 布 式 数据 库 的 性 能 。 

另 一 方面 ， 管 理性 的 查询 几乎 都 集中 在 医院 总 部 的 管理 办 公 室 里 。 产 生 结 论 的 查询 、 向 州 
卫生 机 构 汇 报 治疗 统计 信息 的 总 结 、 医 生效 率 和 效益 等 问题 ， 全 部 是 在 医院 总 部 由 管理 人 员 发 
出 的 。 

山 景 社区 医院 分 布 式 数据 库 设计 的 一 个 建议 是 将 医生 、 病 人 、 过 程 和 消费 数据 进行 水 平分 
割 ， 并 把 它们 分 布 于 本 地 医生 计算 机 里 。 例 如 ， 一 个 科 的 所 有 医生 的 记录 ， 以 这 些 医生 为 主治 
医生 的 所 有 病人 ， 以 及 与 此 相关 的 所 有 活动 的 数据 都 存放 在 医生 办 公 室 的 计算 机 里 。Treatment 
和 Item 数 据 在 各 站 点 上 加 以 复制 。 医院 总 部 的 计算 机 和 外 科 诊 所 的 计算 机 保存 所 有 数据 的 拷贝 ， 
因为 当 病人 正在 医院 或 外 科 诊所 就 诊 时 ， 可 能 需要 访问 所 有 的 数据 ， 而 通 向 办 公 室 的 数据 链 路 
被 关闭 。 

D 你 会 建议 这 个 分 布 式 数据 库 采用 何 种 形式 的 数据 复制 完整 性 控制 ?为 什么 ? 

2) 对 于 以 下 每 个 查询 ， 你 建议 采取 怎样 的 全 局 查询 优化 计划 ? 

a. 上 个 月 每 项 Item 总 共 消 费 多 少 ? 
b. 上 个 月 中 , 医生 办 公 室 、 外 科 诊 所 以 及 医院 总 部 中 每 个 医生 诊治 多 少 名 病人 ? 
c. 按 医疗 科 别 分 类 ， 每 个 医生 在 每 一 科 别 中 开 了 多 少 个 处 方 ? 
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14.1 学 习 目 标 
学 完 本 童 9 后 ， 读 者 应 该 具备 以 下 能 力 : 
* 定 义 下 列 关键 术 庄 : 对象、 状态、 行为、 对象 类 、 类 图 、 对 象 图 、 操 作 、 封 装 、 构 造 器 
操作 、 和 查询 操作 、 更 新 操作 、 范 围 操 作 、 关 联 、 关 联 角色 、 多 重 性 、 关 联 类 、 抽 象 类 、 
具体 类 、 类 范围 属性 、 抽 象 操作 、 方 法 、 多 态 、 重 载 、 多 重 分 类 、 聚 合 和 复合 。 
“描述 面向 对 象 开发 生命 周期 的 不 同 阶段 中 的 活动 。 
* 与 结构 化 方法 相 比 ， 列 举 面向 对 象 建 模 的 优点 。 
* 比较 面 向 对 象 模型 与 ER 和 EER 模 型 的 区 别 。 
“使 用 UML (统一 建 模 语言 ) 类 图 来 建 模 现实 世界 的 应 用 。 
* 使 用 UML 的 对 象 图， 提供 系统 在 某 时 间 点 上 详细 状态 的 快照 。 
"确定 何 时 使 用 概 化 、 聚 合 和 复合 联系 。 
* 说 明 类 图 中 不 同类 型 的 业务 规则 。 


14.2 引言 


在 第 3 章 和 第 4 章 ， 我 们 已 经 学 过 如 何 使 用 ER 模型 和 BER 模 型 进行 数据 建 模 。 在 那些 章 中 已 
学 过 如 何 使 用 实体 、 属 性 和 各 种 联系 来 对 组 织 的 数据 需求 进行 建 模 。 本 章 将 介绍 日 趋 流 行 的 面 
向 对 象 模 型 ， 这 种 模型 能 完全 表示 复杂 的 联系 ， 并 且 以 一 致 的 符号 表示 数据 和 数据 处 理 。 以 前 
学 的 大 部 分 概念 与 面向 对 象 建 模 中 的 概念 是 一 致 的 ， 但 面向 对 象 模型 比 EER 模 型 有 更 多 的 特性 。 

在 第 3 章 和 第 4 章 中 已 提 到 ， 数 据 模型 是 对 现实 世界 的 抽象 。 它 能 通过 关注 一 个 组 织 需要 的 
数据 的 最 本 质 和 最 基本 的 特性 来 处 理 现 实 世界 问题 所 固有 的 复杂 性 。ER 模 型 是 建立 在 实体 的 
基础 上 ， 而 面向 对 象 模型 是 建立 在 对 象 基础 上 。 但 是 ， 我 们 后 面 将 会 看 到 ， 对 象 把 数据 和 行为 
封装 在 一 起 ， 也 就 是 说 ， 面 向 对 象 方法 不 仅 可 以 用 于 数据 建 模 ， 也 可 以 用 于 处 理 建 模 。 为 了 完 
整地 建 模 现实 世界 的 应 用 ， 不 仅 要 建 模 数据 ， 而 且 还 要 建 模 数据 的 处 理 (这 在 第 2 章 有 关 规 划 
对 象 的 信息 中 已 讨论 过 )。 由 于 面向 对 象 方法 能 够 以 一 种 通用 的 方式 表示 数据 和 处 理 ， 而 且 提 
供 了 诸如 继承 和 代码 重用 等 优点 ， 因 此 ， 为 开发 复杂 系统 时 提供 了 功能 强大 的 环境 。 

和 第 2 章 解释 的 系统 开发 生命 周期 概念 类 似 ， 面 向 对 象 的 开发 生命 周期 按 进度 可 以 分 成 三 
个 阶段 一 一 分 析 、 设 计 和 实现 〈 见 图 14-1)。 在 开发 的 早期 阶段 中 ， 开 发 的 模型 是 抽象 的 ， 主 
要 关注 系统 的 外 部 性 质 。 随 着 模型 的 逐步 演化 ， 它 越 来 越 详细 ， 关 注 点 转移 到 系统 怎样 建立 和 
系统 有 怎样 的 功能 上 。 建 模 的 重点 应 该 是 在 分 析 和 设计 阶段 ， 关 注 前 端的 概念 问题 ， 而 不 是 后 
端的 实现 问题 ， 没 有 必要 限制 设计 的 选择 (Rumbaugh 等 ，1991 )。 

在 分 析 阶 段 ， 应 开发 一 个 表示 现实 世界 应 用 的 重要 性 质 的 模型 。 这 个 模型 从 应 用 领域 中 抽 
象 出 概念 ， 并 且 描 述 所 开发 的 系统 应 该 做 些 什么 (what) 事情， 而 不 是 描述 这 个 系统 怎么 
(how) 完成 这 些 事情 。 这 个 模型 应 该 说 明 系统 的 功能 性 行为 ， 这 与 系统 最 后 实现 的 环境 是 无 
关 的 。 你 必须 花 足 够 的 时 间 去 清楚 地 理解 问题 的 需求 。 这 个 分 析 模型 应 该 完整 、 准 确 地 捕捉 问 

号 本 章 的 最 初版 本 由 Wisconsin-Milwaukee 大 学 的 Atish P.Sinha 教 授 编写 。 
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题 的 需求 。 应 该 记 住 ， 在 分 析 阶 段 修改 或 修正 错误 要 比 在 以 后 的 阶段 完成 这 些 工 作 容 易 得 多 ， 
且 花 费 少 得 多 。 


- 系统 体系 结构 


- 程序 设计 


-数据库 访问 
- 数据 访问 
- 算法 
”控制 








图 14-1 面向 对 象 系统 开发 生命 周期 的 阶段 


住 面向 对 象 设计 阶段 ， 要 定义 面向 应 用 的 分 析 模 型 怎样 在 实现 环境 中 实现 。Jacobson 等 人 
在 1992 年 列举 了 使 用 面向 对 象 设计 的 三 个 理由 。 这 三 个 理由 如 下 所 述 : 

1) 分 析 模 型 不 足以 直接 用 程序 设计 语言 去 实现 。 为 了 能 无 颖 地 转换 成 源 代码 ， 还 需要 通过 
下 列 决 策 对 对 象 作 进一步 的 精 化 : 一 个 对 象 将 提供 哪些 操作 ， 对 象 之 间 应 该 如 何 通信 ， 它 们 之 
间 传 递 哪些 消息 ， 等 等 。 

2) 实际 系统 必须 适应 系统 将 要 实现 的 环境 。 要 达到 这 个 目标 ， 在 将 分 析 模 型 转换 成 设计 模 
型 时 ， 必 须 考虑 到 不 同 的 因素 ， 例 如 性 能 需求 、 实 时 需求 和 并 发 性 、 目 标 硬 件 和 系统 软件 、 相 
应 的 DBMS 和 程序 设计 语言 等 。 

3) 使 用 面向 对 象 设计 能 够 确认 分 析 的 结果 。 在 设计 阶段 ， 可 以 验证 来 自分 析 的 结论 是 否 适 
合 于 建立 这 个 系统 ， 是 否 要 对 分 析 模型 做 出 必要 的 修改 。 

为 了 开发 设计 模型 ， 你 必须 确认 和 审查 实现 环境 对 设计 将 产生 哪些 影响 (Jacobson 等 ， 
1992)。 应 该 做 出 所 有 策略 性 的 设计 决定 ， 例 如 怎样 整合 DBMS ， 进 程 间 通信 和 错误 处 理 怎样 
完成 ,重用 哪些 组 件 库 等 。 接 下 来 ,应 该 将 这 些 决定 整合 到 最 初 的 设计 模型 中 以 适应 实现 环境 ， 
最 后 ， 应 该 对 设计 模型 形式 化 ， 以 描述 在 各 种 可 能 的 场景 下 (用例 ) 对 象 相互 之 闻 如 何 交互 。 

Rumbaugh 等 人 在 1991 年 把 设计 活动 分 成 两 个 阶段 : 系统 设计 和 对 象 设计 。 作 为 系统 设计 
人 员 ， 应 该 提出 一 个 总 的 系统 体系 结构 ， 按 不 同 的 组 件 ( 称 为 子 系统 ) 组 织 系 统 ， 并 给 出 做 出 
决定 的 相关 语 境 ， 例 如 确定 并 发 性 ; 分 配子 系统 到 处 理 器 或 任务 中 ; 处 理 对 全 局 资源 的 访问 ， 
在 软件 中 选择 一 个 控制 的 实现 等 等 。 

在 对 象 设计 阶段 ， 按 照 系统 设计 阶段 所 确定 的 策略 ， 通 过 在 分 析 模型 中 加 入 实现 细节 来 建 
立 设计 模型 。 这 些 细节 有 : 为 了 改善 有 效 性 而 重新 构造 类 ， 实现 每 个 类 的 内 部 数据 结构 和 算法 ， 
控制 的 实现 ， 关 联 的 实现 ， 以 及 打包 成 物理 模块 。 分 析 模型 中 应 用 领域 的 对 象 类 仍 应 保留 ， 但 
应 该 增加 计算 机 领域 的 成 分 ， 以 优化 重要 的 性 能 指标 。 

设计 阶段 完成 后 就 进入 实现 阶段 。 在 实现 阶段 ， 要 使 用 程序 设计 语言 或 DBMS 实 现 设计 。 
把 设计 转换 成 程序 代码 是 比较 容易 的 过 程 ， 因 为 设计 模型 已 经 整合 了 程序 设计 语言 和 DBMS 的 
细微 之 处 。 

Coad 和 Yourdon (1991b) 给 出 了 面向 对 象 建 模 的 一 些 动机 和 益处 ， 如 下 所 述 : 
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。 处 理 更 具 挑 战 性 的 问题 领域 的 能 力 。 

改善 了 用 户 、 分 析 者 、 设 计 者 和 程序 员 之 间 的 交流 。 

。 提 高 了 分 析 、 设 计 和 程序 设计 活动 之 问 一 致 性 。 

。 明 确 地 表示 了 系统 组 件 之 间 的 共性 。 

。 系 统 的 健壮 性 。 

。 分 析 、 设 计 和 程序 设计 结果 的 可 重用 性 。 

。 提 高 了 在 面向 对 象 分 析 、 设 计 和 程序 设计 阶段 开发 的 所 有 模型 的 一 致 性 。 

最 后 一 点 需 进 一 步 说 明 。 在 结构 化 分 析 和 设计 的 建 模 方法 (第 2 章 中 介绍 的 ) 中 ， 开 发 的 
模型 (例如 , 分析 阶段 的 数据 流 图 和 设计 阶段 的 结构 图 ) 缺乏 通用 的 表示 ， 因 此 很 难 联系 起 来 。 
与 这 些 方法 所 固有 的 不 连续 和 不 相交 的 转化 相 比 ， 面 向 对 象 方法 提供 了 从 分 析 到 设计 再 到 实现 
的 连续 的 表示 (Coad 和 Yourdon，1991a)， 形 成 了 从 一 个 模型 到 另 一 个 模型 无 颖 的 转化 
(Jacobson 等 ，1992)。 例 如 ， 从 面向 对 象 分 析 转 向 面向 对 象 设 计 需 要 用 与 实现 有 关 的 细节 扩展 
分 析 模 型 ， 但 不 用 开发 整个 新 的 表示 。 

本 章 介绍 的 面向 对 象 数据 建 模 是 作为 高 级 概念 活动 提出 的 。 正 如 在 第 15 章 中 将 要 介绍 的 一 
个 好 的 概念 模型 对 于 设计 和 实现 面向 对 象 数据 库 应 用 的 作用 是 无 法 估价 的 。 


14.3 统一 建 模 语言 


统一 建 模 语言 (Unified Modeling Language，UML) 是 “一 种 用 于 说 明 、 可 视 化 和 构造 软 
件 系统 制品 的 语言 ， 这 种 语言 也 能 用 于 商业 建 模 ”( UML Document Set，1997)。 Grady Booch、 
Ivar Jacobson 和 James Rumbaugh 等 三 位 一 流 专家 通过 努力 ， 定 义 了 一 种 面向 对 象 建 模 语言 ， 他 
们 希望 该 语言 在 不 和 久 的 将 来 能 成 为 一 个 行业 标准 。UML 建 立 在 Booch (Booch，1994)、OOSE 
(Jacobson 等 ，1992) 和 OMT (Rumbaugh 等 ，1991) 等 方法 以 及 其 他 一 些 先 进 方法 的 语义 和 概 
念 之 上 ， 并 且 把 它们 统一 起 来 。 

UML 符 号 对 于 用 图 形 表 示 面 向 对 象 分 析 或 设计 模型 是 很 有 用 的 。 UML 不 仅 能 说 明 系 统 的 
需求 并 捕捉 设计 决策 ， 而 且 能 够 促进 开发 工作 中 关键 人 员 之 间 的 交流 。 开 发 者 能 够 使 用 UML 
符号 表示 的 分 析 或 设计 模型 来 与 领域 专家 、 用 户 和 其 他 项 目 相关 人 员 进 行 交流 。 

为 了 有 效 地 表示 一 个 复杂 的 系统 ， 所 开发 的 模型 必须 具有 不 同 的 视点 或 角度 。 通 过 提供 不 
同类 型 的 图 ，UML 能 够 从 多 种 角度 表示 系统 ， 这 些 图 包括 用 例 图 、 类 图 、 状 态 图 、 交 互 图 、 
组 件 图 和 部 署 图 。 基 本 的 模型 集成 了 这 些 不 同 的 视图 ， 从 而 能 以 完整 、-- 致 的 方式 来 加 以 分 析 、 
设计 和 实现 系统 。 | 

由 于 本 书 是 介绍 数据 库 ， 所 以 将 只 论述 类 图 ， 它 只 解决 了 系统 的 数据 和 某 些 行为 方面 的 问题 。 
而 其 他 一 些 图 提供 的 角度 不 直接 与 数据 库 系 统 有 关 ， 例 如 有 关系 统 的 动态 方面 ， 所 以 本 书 就 不 
介绍 了 。 但 是 应 注意 ， 数 据 库 系统 通常 只 是 整个 系统 中 的 一 部 分 ， 而 整个 系统 的 模型 应 该 包括 
系统 的 各 个 方面 。 有 关 其 他 UML 图 的 讨论 ， 请 看 Hoffer、George 和 Valacich (2002) 等 人 的 著作 。 


14.4 面向 对 象 数据 建 模 


本 节 将 介绍 面向 对 象 数据 建 模 。 在 面向 对 象 建 模 中 涉及 到 的 主要 概念 和 技术 有 : 对 象 和 
类 ; 属性 和 操作 的 封装 ; 关联 、 概 化 和 聚合 联系 ; 基数 和 其 他 类 型 约束 ; 多 态 以 及 继承 。 下 面 
将 介绍 如 何 使 用 UML 符 号 来 开发 类 图 ， 以 提供 被 建 模 的 系统 的 概念 视图 。 
14.4.1 表示 对 象 和 类 

在 面向 对 象 方法 中 ， 用 对 象 来 建 模 现实 世界 。 在 把 这 个 方法 应 用 到 现实 世界 问题 之 前 ， 应 
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该 先 理解 什么 是 对 象 。 对 象 (object) 是 一 个 实体 ， 在 应 用 领域 内 有 定义 明确 的 角色 、 状 态 、 
行为 和 标识 。 一 个 对 象 是 一 个 概念 、 抽 象 ， 或 在 应 用 语 境 中 有 意义 的 事物 (Rumbaugh 等 ， 
1991 ) 。 一 个 对 象 可 以 是 一 个 可 触及 或 可 见 的 实体 (例如 一 个 人 、 位 置 或 东西 ) ， 也 可 以 是 一 个 
概念 或 事件 (例如 部 门 、 性 能 、 婚 姻 、 注 册 等 )， 还 可 以 是 设计 过 程 的 制品 (例如 用 户 界 面 、 
控制 器 、 调 度 者 等 )。 

你 可 能 想 知 道 ， 对 象 与 第 3 章 研究 的 ER 模型 中 的 实体 有 什么 不 同 。 显 然 ，ER 模 型 中 的 实体 
可 以 用 对 象 模型 中 的 对 象 来 表示 。 但 是 除了 存储 状态 (信息 ) 之 外 ， 对 象 还 通过 能 检查 或 影响 
状态 的 操作 表现 它 的 行为 。 

对 象 的 状态 (state) 包含 它 的 性 质 ( 属性 和 联系 ) 以 及 这 些 性 质 有 具有 的 值 。 对 象 的 行为 
(behavior) 表示 对 象 怎样 动作 和 如 何 响应 (Booch，1994)。 对 象 的 状态 是 由 它 的 属性 值 以 及 
与 其 他 对 象 的 链接 决定 的 。 对 象 的 行为 取决 于 它 的 状态 和 执行 的 操作 。 一 个 操作 就 是 一 个 动作 ， 
表示 一 个 对 象 为 了 获得 响应 而 在 另 一 个 对 象 上 执行 的 动作 ， 也 可 以 将 操作 看 作 一 个 对 象 (供应 
者 ) 提供 给 他 的 客户 的 一 个 服务 。 客 户 发 送 消 息 给 供应 者 ， 而 供应 者 通过 执行 相应 的 操作 提供 
所 需 的 服务 。 

考虑 一 个 有 关 学 生 的 例子 ，Mary Jones 可 以 看 成 一 个 对 象 。 这 个 对 象 的 状态 用 属性 和 其 当 
前 值 来 刻画 ， 其 中 属性 有 姓名 、 出 生日 期 、 年 级 、 地 址 和 电话 ， 这 些 属性 都 有 相应 的 值 。 例 如 ， 
其 姓名 是 “Mary Jones”， 年 级 是 “junior”( 三 年 级 ) 等 等 。 对 象 的 行为 是 通过 操作 表示 的 ， 
例如 操作 calc-gpa 用 来 计算 一 个 学 生 的 当前 成 绩 绩 点 的 平均 值 。 因 此 Mary Jones 对 象 把 她 的 状 
态 和 行为 封装 在 一 起 。 。 

所 有 的 对 象 都 有 一 个 标识 ， 也 就 是 说 ， 没 有 两 个 对 象 是 相同 的 。 例 如 ， 有 两 个 学 生 有 同样 
的 姓名 和 出 生日 期 ， 但 他 们 本 质 上 仍 是 两 个 不 同 的 对 象 。 即 使 他 们 的 所 有 属性 都 有 相同 的 值 ， 
但 仍 有 不 同 的 标识 。 同 时 ， 每 个 对 象 在 它 的 生命 周期 内 保持 自己 的 标识 不 变 。 例 如 ， 如 果 
Mary Jones 结 婚 了 ， 其 姓名 、 地 址 和 电话 改变 了 ， 但 她 仍然 是 同一 个 对 象 。 

术语 “对 象 ” 有 时 指 的 是 一 组 对 象 ， 而 不 是 单个 的 对 象 。 这 可 以 从 语 境 中 来 区 分 。 但 严格 
地 说 ,，“ 对象” 是 指 单个 对 象 ， 而 不 是 一 类 对 象 。 下 面 我 们 再 对 此 作 解 释 。 如 果 要 消除 可 能 的 
混淆 ， 那 么 可 使 用 “对 象 实例 ”来 表示 单个 的 实体 ， 而 用 对 象 类 (object class， 或 直接 用 类 ) 
表示 共享 公共 结构 和 公共 行为 的 一 组 对 象 (就 像 第 3 章 中 的 实体 类 型 和 实体 实例 })。 在 上 面 的 例 
子 中 ，Mary Jones 是 一 个 对 象 实例 ， 而 所 有 学 生 (Student) 是 一 个 对 象 类 。 

可 以 用 图 14-2a 的 类 图 来 描述 类 。 类 图 (class diagram ) 表示 面向 对 象 模型 的 静态 结构 ， 其 
中 包括 对 象 类 ， 对 象 类 的 内 部 结构 和 对 象 类 参与 的 联系 。 在 UML 中 ， 一 个 类 用 一 个 矩形 框 表 
示 ， 和 拢 形 框 用 水 平 线 分 隔 成 三 个 部 分 。 类 的 名 字 出 现在 最 上 面 一 部 分 ， 属性 列 在 中 间 一 部 分 ， 
操作 放 在 最 下 面 一 部 分 。 这 个 图 表示 了 两 个 类 (Student 和 Course) 以 及 它们 的 属性 和 操作 ， 

Student 类 是 共享 公共 结构 和 公共 行为 的 一 组 Student 对 象 。 所 有 学 生 有 公共 的 性 质 : 姓名 、 
出 生日 期 、 年 级 、 地 址 和 电话 。 它们 还 通过 共享 calc_age、calc_gpa 和 register_for (course) 操 
作 表 示 公 共 的 行为 。 因 此 ,一 个 类 为 类 实例 提供 了 模板 或 模式 。 每 个 对 象 知道 它 应 属于 哪个 类 。 
例如 ，Mary Jones 对 象 知道 它 应 属于 Student 类 。 属于 同一 个 类 的 对 象 可 以 参与 与 其 他 对 象 类 似 
的 联系 。 例 如 ， 所 有 学 生 都 要 选修 课程 ， 因 此 Student 类 要 参与 与 Course 类 的 联系 “register_for” 
(参见 14.4.3 节 )。 

对 象 图 (object diagram) 也 称 为 实例 图 ， 它 是 与 给 定 类 图 相 兼容 的 实例 图 。 图 14-2b 表 示 
有 两 个 实例 的 对 象 ， 分 别 表 示 图 14-2a 中 出 现 的 两 个 类 的 一 个 实例 。 如 图 所 示 ， 一 个 静态 对 象 
图 是 类 图 的 一 个 实例 , 提供 了 系统 在 某 一 时 刻 的 详细 状态 的 快照 (UML Notation Cuide，1997 )。 
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这 里 提供 的 只 是 静态 对 象 图 的 例子 ， 而 不 是 动态 对 象 图 〈 称 为 协作 图 ) 的 例子 。 




























name crse-code 
dateOfBirth crse-title 
year 属性 列表 credit-hrs 
address 

phone 

calc-age( ) | enroliment( ) 
calc-gpa( ) 操作 列表 










register-for(course) 





a) 表示 两 个 类 的 类 图 


Mary Jones: Student 


:Course 


crse-code = MIS385 
crse-title = Database Mgmt 
credit-hrs = 3 





name = Mary jones 





dateOfBirth = 4/15/78 
year = junior 






b) 有 网 个 实例 的 对 象 图 
图 14-2 UML 类 图 和 对 象 图 


在 对 象 图 中 ， 每 个 对 象 用 分 隔 成 两 部 分 的 年 形 框 表示 。 对 象 的 名 字 和 对 象 所 属 的 类 被 加 上 
下 划 线 ， 放 在 矩形 框 的 顶部 ， 其 句法 如 下 : 

对 象 名 : 类 名 
对 象 的 属性 和 值 放 在 第 二 部 分 。 例 如 ， 有 一 个 对 象 称 为 Mary Jones， 它 属于 Student 类 。 姓 名 、 
出 生日 期 和 年 级 等 属性 值 也 在 图 中 标 出 。 不 感 兴趣 的 属性 值 可 以 不 标 出 。 例 如 ，Mary Jones 的 
地 址 、 电 话 属性 就 未 标 出 。 如 果 对 对 象 的 所 有 属性 都 不 感 兴趣 ， 那么 整个 第 二 部 分 可 被 取消 。 
对 象 的 名 字 也 可 省 去 , 但 冒号 和 类 名 仍 应 保留 ， 如 图 中 Course 的 实例 所 示 。 如 果 标 出 了 对 象 名 ， 
那么 其 后 的 冒号 以 及 类 名 也 可 省 去 。 

操作 (operation) 是 由 类 的 所 有 实例 提供 的 函数 或 服务 ， 例 如 Student 中 的 calc_gpa (参见 
图 14-2a)。 只 有 通过 这 样 的 操作 ， 其 他 对 象 才 能 访问 或 操纵 存储 在 这 个 对 象 中 的 信息 。 因 此 ， 
操作 给 类 提供 了 外 部 接口 ; 这 个 接口 表示 类 的 外 部 视图 ， 而 不 显示 它 的 内 部 结构 或 它 的 操作 如 
何 实现 。 这 种 在 外 部 视图 中 隐藏 对 象 的 内 部 实现 细节 的 技术 称 为 封装 (encapsulation ) 或 信息 
隐蔽 (Booch，1994; Rumbaugh 等 ，1991 ) 。 在 我 们 提供 公共 行为 的 抽象 给 接口 中 类 的 所 有 实 
例 时 ， 在 类 之 间 封 装 了 类 的 结构 和 应 有 行为 的 秘密 。 
14.4.2 操作 的 类 型 . 

根据 客户 需要 的 服务 种 类 ， 操 作 可 以 分 成 四 种 类 型 ， 构 造 器 (constructor)、 查 询 (query)、 
更 新 (update) 和 范围 (scope) (UML Notation Guide ，1997 )。 构 造 器 操作 (constructor 
operation ) 创建 类 的 一 个 新 实例 。 例 如 ， 在 Student 中 有 create-student 操 作 ， 用 于 创建 一 个 新 的 学 
生 并 初始 化 其 状态 。 这 种 构造 器 操作 对 所 有 类 都 是 适用 的 ， 因此 在 类 图 中 就 不 必 明 确 地 标 出 。 

查询 操作 (query operation) 是 设 有 任何 副作用 的 操作 。 这 个 操作 能 访问 一 个 对 象 的 状态 ， 
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但 不 能 改变 其 状态 (Flowler，2000; Rumbaugh 等 ，1991)。 例 如 ，Student 类 有 一 个 操作 get- 
year (未 标 出 ) ， 用 于 检索 查询 中 指定 的 Student 对 象 的 年 级 (新生 、 二 年 级 、 三 年 级 、 四 年 级 )。 
由 于 这 个 操作 检索 基 属 性 的 独立 值 ， 因 此 在 类 图 中 不 必 明 确 表示 get-year 这 个 查询 操作 。 再 考 
察 Student 中 的 calc-age 操 作 ， 这 也 是 一 个 没有 任何 副作用 的 查询 操作 。 这 个 查询 惟一 的 参数 是 
日 标 Student 对 象 。 这 样 的 查询 可 以 表示 成 导出 属性 (Rumbaugh 等 ，1991)。 例 如 ， 可 以 将 
“age” 表 示 为 Student 的 导出 属性 。 由 于 目标 对 象 总 是 一 个 隐 式 操作 变量 ， 因 此 在 操作 声明 中 不 
必 明 确 表示 出 来 。 

更 新 操作 (update operation) 有 副作用 ， 它 要 改变 对 象 的 状态 。 例 如 ， 考 虑 Student 的 操作 
promote-student (未 标 出 )。 这 个 操作 是 让 学 生 升 到 新 的 年 级 ， 例 如 从 三 年 级 升 到 四 年 级 ， 因 
而 改变 了 Student 对 象 的 状态 (年 级 属性 的 值 )。 另 外 一 个 更 新 操作 例子 是 register-for (course)， 
这 个 操作 建立 Student 对 象 与 特定 的 Course 对 象 之 间 的 连接 。 要 注意 ， 这 个 操作 除了 把 日 标 
Student 对 象 作为 隐 式 变量 外 ， 还 有 一 个 显 式 变量 “course”， 它 指定 学 生 想 要 注册 的 课程 。 显 
示 变 晤 用 括号 插 起 来 。 

范围 操作 (scope operation) 是 应 用 于 类 而 不 是 应 用 于 对 象 实例 的 操作 。 例 如 ， 适 用 于 
Student 类 的 avg_gpa (在 图 14-2 中 ， 这 个 类 的 操作 中 未 标 出 ) 计算 所 有 学 生 的 平均 gpa 值 (用 下 
划 线 标 出 操作 名 表示 它 是 -一 个 范围 操作 )。 

14.4.3 表示 关联 

与 ER 模型 中 联系 的 定义 一 样 ， 关 联 (association) 是 指 两 个 或 多 个 对 象 类 的 实例 之 间 的 已 
命名 的 联系 。 与 ER 模型 一 样 ， 一 个 关联 联系 的 度数 可 以 是 一 元 、 二 元 、 三 元 或 多 元 (n 元 )。 
图 14-3 使 用 了 图 3-12 的 例子 来 说 明 怎样 用 面向 对 象 模型 来 表示 不 同 度数 的 关联 联系 。 一 个 关联 
用 参与 类 之 间 的 实 线 表 示 。 关 联 端 (也 就 是 与 类 相连 的 端 ) 称 为 关联 角色 (association role， 
UML Notation Guide，1997)。 每 个 关联 有 两 个 或 多 个 角色 。 每 个 角色 可 以 在 靠近 关联 端的 地 
方 用 标号 来 显示 命名 (参见 图 14-3a 中 的 “manager” 角 色 )。 角 色 名 指出 这 个 类 在 关联 中 所 起 
的 作用 。 角 色 名 的 使 用 是 可 选择 的 。 你 也 可 以 在 关联 名 处 指定 角色 名 。 

图 14-3a 表 示 两 个 一 元 关联 ， 即 Is-married-to (婚姻 ) 和 Manages (管理 )。 在 Manages 联 系 的 
一 端 ， 有 名 为 “manager” 的 和 角色， 表示 一 个 职员 可 以 担任 经 理 的 角色 。 而 其 他 角色 没有 命名 ， 
但 是 对 关联 已 命名 了 。 在 角色 名 没有 出 现时 ， 可 以 把 与 端 部 相连 的 类 的 名 字 作 为 角色 名 。 
(Fowler，2000)。 例如， 在 图 14-3b 中 ， Is-assigned 联 系 右 端的 角色 就 以 类 名 Parking Place 来 称呼 。 

每 个 角色 都 有 多 重 性 (multiplicity )， 多 重 性 是 指 在 一 个 给 定 的 联系 中 有 多 少 对 象 参 与 。 
在 类 图 中 ， 多 重 性 规范 以 用 整数 区 间 表 示 的 文本 串 表示 ， 其 格式 如 下 : 

下 有 界 .. 上 界 

这 个 区 间 是 一 个 闲 区 间 ， 表 示范 围 既 包 括 上 界 也 包括 下 界 。 例 如 ， 多 重 性 2..5 表 示 在 一 个 
给 定 的 联系 中 可 参与 对 象 的 数目 的 最 小 值 为 2， 最 大 值 为 5。 因 此 ， 多 重 性 只 不 过 是 第 3 章 中 讨 
论 过 的 基数 约束 。 多 重 性 的 上 界 除了 整数 以 外 ， 还 可 以 是 星 号 “*”， 该 符号 表示 一 个 无 穷 大 的 
上 界 。 如 果 只 指定 一 个 整数 值 ， 那 么 表示 范围 只 能 取 这 个 整数 值 。 

实际 上 ， 最 常用 的 多 重 性 是 0..1、* 和 1。 多 重 性 0..1 表 示 最 小 值 是 0 和 最 大 值 是 1 ( 可 选 一 )， 
而 * (或 0..*) 表示 范围 从 0 到 无 穷 大 (可 选 多 )。 而 单个 1 代表 1..1， 表示 联系 中 参与 的 对 象 数目 
恰好 是 1 (强制 1 )。 

在 Js-married-to 联 系 中 ， 任 一 角色 的 多 重 性 都 是 0.1， 表示 每 个 人 可 以 是 单身 ， 也 可 以 与 另 

个 人 结婚 。 对 于 Manages 联 系 中 的 manager 角 色 的 多 重 性 是 0..1， 而 另 一 个 角色 是 *， 表 示 每 
个 职员 只 能 由 一 个 经 理 管理 ， 但 一 个 经 理 可 管理 多 个 职员 。 
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0..1 
0..1 





全 


Is-married-to Manages 





Employee 


0..1 | manager 





a) “元 联系 





.. ls-assigned , Parking 
Employee Place 


Product 1 Contains > 1 Product 
Line 
-对 多 
* Registers-for * 
多 对 多 






c) 一 元 联系 


图 14-3 不 同 度数 的 关联 联系 的 例子 


图 14-3b 表 示 三 个 二 元 联系 ， 即 Is-assigned (一 对 一 )、Contains (一 对 多 ) 和 Registers-for 
(多 对 多 )。 虽 然 在 类 图 中 ， 关 联名 可 以 沿 着 一 个 方向 读 ， 但 是 二 元 关联 是 固有 的 双向 联系 
(Rumbaugh 等 ，1991)。 例 如 ，Contains 关 联 可 读 成 从 Product Line 到 Product 的 关联 (注意 , 在 
此 例 中 ， 可 以 在 关联 名 上 加 个 实心 三 角形 明确 表示 方向 )。 但 是 ，Contains 隐 含 着 一 个 相反 的 侦 
历 Belongs-to， 它 表示 一 个 产品 属于 某 个 产品 系列 。 这 两 个 遍历 的 方向 提供 了 相同 的 基本 关 
联 ; 关联 名 可 直接 在 一 个 方向 上 建立 。 

Is-assigned 联 系 的 图 表示 给 每 个 员工 分 配 一 个 停车 位 或 根本 不 分 配 停 车 位 (可 选 一 )。 从 另 
一 个 方向 读 ， 可 以 说 每 个 停车 位 被 分 配给 一 个 员工 或 者 根本 不 分 配给 员工 (也 是 可 选 一 )。 类 
似 地 ， 每 个 产品 系列 中 可 以 有 多 个 产品 ， 但 至 少 有 一 个 产品 ， 反 之 ， 每 个 产品 只 能 属于 一 个 产 
品系 列 〈 强 制 一 )。 第 三 个 二 元 关联 图 说 明 每 个 学 生 可 注册 多 门 课程 ， 但 也 可 能 根本 不 注册 课 
程 ， 而 一 般 每 门 课程 有 许多 学 生 注册 (两 个 方向 都 为 可 选 多 个 )。 
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在 图 14-3c 中 , 在 Vendor、Part 和 和 Warehouse 之 间 存 在 着 一 个 三 元 联系 Supplies。 与 ER 图 一 样 ， 
用 菱形 符号 表示 三 元 联系 ， 并 在 其 中 填 上 联系 的 名 字 。 与 第 3 章 讨论 的 一 样 ， 联 系 是 多 对 多 对 
多 ， 并 且 不 可 以 用 三 个 二 元 联系 替换 ， 否 则 势必 造成 信息 丢失 。- 

图 14-4a 中 的 类 图 表示 如 下 二 元 关联 : Student 和 Faculty 之 间 的 关联 ，Course 和 Course 
Offering 之 间 的 关联 ，Student 和 Course Offering 之 间 的 关联 ， 以 及 Faculty 和 Course Offering 之 间 
的 关联 。 这 个 类 图 表示 一 个 学 生 可 以 有 一 个 导师 ， 而 一 个 导师 可 指导 多 达 10 个 学 生 。 另 外 ， 一 
门 课程 可 以 有 多 个 设置 ， 而 一 个 课程 设置 恰好 对 应 一 门 课程 。UML 可 以 用 数值 来 说 明 任何 多 
重 性 。 例 如 ， 图 中 表示 每 个 课程 设置 可 以 由 1 名 或 2 名 讲师 (1，2) 授课 。 可 以 使 用 一 个 数值 
(例如 用 2 表示 桥牌 队 的 成 员 数 目 )、 范 围 (例如 用 11..14 表 示 参 与 足球 比赛 的 人 数 ) 或 数值 与 范 
围 的 离散 集 〈 例 如 用 3、5、7 表 示 委 员 会 成 员 的 人 数 ， 用 20..32、35..40 表 示 公 司 里 每 个 职员 每 
周 用 小 时 计 的 工作 量 )。 





advisees 


0..10 
Student 








b) 顾客 订单 的 例子 


图 14-4 二 元 关联 联系 的 例子 


图 14-4a 还 表示 教师 扮演 讲师 的 角色 ， 也 扮演 着 导师 的 角色 。 导 师 (advisor) 角色 标识 
与 Student 对 象 关联 的 Faculty 对 象 ， 指 导 (advisees ) 标识 着 与 一 个 Faculty 对 象 关联 的 一 个 
Student 对 象 集 。 也 可 以 命名 这 个 关联 为 Advises， 但 此 时 ， 该 角色 名 能 充分 表示 联系 的 语义 。 

图 14-4b 表 示 顾 客 订 单 的 另 一 个 类 图 。 图 14-5 是 相应 的 对 象 图 ， 图 中 显示 了 类 的 若干 实例 
及 其 实例 之 间 的 链接 情况 (注意 ， 每 个 实例 属于 一 个 类 ， 每 个 链接 属于 一 个 联系 )。 在 本 例 中 ， 
两 个 顾客 Joe 和 Jane 下 了 若干 订单 。Joe 下 了 2 个 订单 : Ord 20 和 Ord 56。 在 Ord 20 中 ， Joe 订 购 运 
动产 品系 列 中 的 产品 P93。 在 Ord 56 中 ， 他 再 次 订购 同样 的 运动 产品 以 及 硬件 产品 系列 中 的 产 . 
品 PS0。Jane 订 购 了 和 Joe 同 样 的 硬件 产品 ， 还 有 两 个 化 妆 品 产品 系列 的 产品 (P9 和 P10)。 
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Ord20: Order P93: Product 










Reguesis 















Places Includes 
Reguests 
Sports: Hardware: Cosmetics: 
Product Line roduct Line Product Line 
, Includes Includes 
上 
Ord56: Order 
Requests 
P50: Product P9: Product P10: Product 


Requests 
Requests 


Requests 


Ord45: Order 


Places 


jane: Customer 


14.4.4 表示 关联 类 

当 关联 本 身 也 有 属性 或 自己 的 操作 ， 或 者 关联 参与 其 他 类 的 联系 时 ， 把 关联 建 模 成 关联 类 
(association class) 是 很 有 用 的 〈 就 像 第 3 章 中 使 用 的 “关联 实体 * )。 例 如 ， 在 图 14-6a 中 ， 属 性 
term 和 grade 实 际 上 属于 Student 和 Course 之 间 多 对 多 关联 。 除 非 学 生 和 课程 都 已 知 ， 否则 学 生 某 
门 课程 的 成 绩 是 不 能 确定 的 。 类 似 地 ， 要 找 学 生 在 哪个 学 期 选修 该 门 课程 ， 也 必须 知道 学 生 和 
课程 。checkEligibility 操 作用 于 测试 学 生 是 否 有 资格 注册 给 定 的 课程 ， 这 个 操作 属于 关联 ， 但 
不 属于 参与 这 个 关联 的 两 个 类 中 任何 一 个 类 。 我 们 还 发 现 ， 对 于 某 门 课程 注册 ， 会 给 学 生 提 供 
一 个 计算 机 账号 。 因 此， 可 以 把 Registration 建 模 成 一 个 关联 类 ,这 个 关联 有 它 自 己 的 一 组 特性 ， 
并 与 其 他 类 (Computer Account) 有 一 个 关联 。 类 似 地 ， 对 于 一 元 关联 Tutors、beginData 和 
numberOfHrs (授课 时 数 ) 实际 上 属于 这 个 关联 ， 因 此 应 出 现在 单独 的 关联 类 中 。 


图 14-5 顾客 订单 例子 的 对 象 图 
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全 
Course 


Computer Account 


acctID 
Password 
serverSpace 













lulor Student 
Pupilj* 
Tutors 


beginDate 
numberOfHrs 
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* 0..1 





a) 表示 关联 类 的 类 图 


term = Fall2001 
grade = W 
1 





















Mary Jones 







:Computer Account 


acctlD = jones385 
password = 12345 
serverSpace = 10 


term = Fall2001 


b) 表示 链接 对 象 的 对 象 图 
图 14-6 关联 类 和 链接 对 象 


关联 类 的 名 字 可 以 在 关联 路 径 上 表示 ， 也 可 用 类 符号 表示 ， 也 可 以 两 种 方法 都 使 用 。 当 关 
联 只 有 一 个 属性 但 没有 任何 操作 ， 也 不 参与 其 他 关联 时 ， 可 在 关联 路 径 上 标 出 名 字 ， 并 在 关联 
类 符号 中 省 赂 属性 ， 以 便 强调 它 的 “关联 本 质 ”( UML Notation Guide，1997 )。 这 就 像 Tutors 
关联 所 表示 的 那样 。 另 一 方面 ，Registration 关 联 有 两 个 属性 和 一 个 它 自 己 的 操作 ， 还 有 一 个 与 
Computer Account 的 关联 Issues ， 这 个 关联 的 名 字 在 类 和 矩形 框 中 表示 ，、 以 强调 它 的 “类 本 质 ”。 

图 14-6b 表 示 的 是 学 生 Mary Jones 及 她 在 2001 年 第 一 学 期 注册 的 课程 MKT350 和 MIS385 的 对 
象 图 的 一 部 分 。 与 类 图 中 关联 类 相对 应 ， 在 对 象 图 中 也 存在 链接 对 象 。 在 这 个 例子 中 ， 对 于 
Registration 关 联 类 有 两 个 有 链接 对 象 (表示 成 : Registration ) ， 有 两 门 课程 注册 。 这 张 图 还 显示 ， 
对 于 MIS385 课 程 ，Mary Jones 得 到 带 有 账号 、 口 令 和 指定 服务 器 空间 的 计算 机 账户 。 她 还 没 取 
得 MIS385 这 门 课 的 成 绩 ， 但 对 于 MKT350 课 程 ， 由 于 她 取消 了 这 门 课 因 此 获得 了 成 绩 W。 

图 14-7 表 示 的 是 Student、Software 和 Course 这 三 个 类 之 间 的 一 个 三 元 联系 。 它 表示 这 样 一 
个 事实 ， 学 生 对 于 不 同 的 课程 使 用 了 各 种 软件 工具 。 例 如 ， 需 要 存储 这 样 的 信息 ，Mary Jones 
对 于 Database Management 这 门 课程 使 用 了 Microsoft Access 和 Oracle 软 件 ， 对 于 Object-Oriented 
Modeling 课 程 使 用 Rational Rose 和 Visual C++ 软件 ， 对 于 Expert System 课程 使 用 了 Levels Object 
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软件 。 假 定 我 们 现在 想 要 知道 Mary 每 周 在 Database Management 课 程 中 使 用 Oracle 软 件 花费 的 
小 时 数 。 这 个 处 理 实际 上 属于 三 元 关联 ， 而 不 属于 某 个 类 。 因 此 ， 可 创建 一 个 称 为 Log 的 关联 
类 ， 在 这 个 关联 类 中 再 声明 一 个 称 为 estimateUsage 的 操作 。 除 了 这 个 操作 外 ， 还 指定 属于 这 个 
关联 的 三 个 属性 : beginData、expiryData 和 hoursLogged。 






don ， 





beginDate 


expiryDate 
hoursLogged 








estimateUsage( ) 
图 14-7 带 有 关联 类 的 三 元 联系 


14.4.5 表示 导出 属性 、 导 出 关联 和 导出 角色 
导出 属性 、 导 出 关联 和 导出 角色 是 分 别 可 从 其 他 属性 、 关 联 和 角色 计算 或 导出 的 (导出 属 
性 的 概念 在 第 3 章 已 介绍 过 )。 导 出 元 素 (属性 、 关 联 和 角色 ) 在 元 素 名 前 加 一 个 斜 线 (/) 来 表 
示 。 例 如 在 图 14-8 中 ， 由 于 年 龄 可 利用 出 生日 期 和 当前 日 期 计算 出 来 ， 因 此 age 是 Student 的 一 
个 导出 属性 。 由 于 计算 是 在 对 象 类 上 的 一 个 约束 ， 因 此 该 计算 可 以 在 图 中 Student 对 象 类 的 上 方 
用 { } 标 出 。 还 有 ，Student 和 Course 之 间 的 Takes 联 系 也 是 可 导出 的 ， 这 是 因为 Takes 联 系 可 以 从 
Registers-for 和 Scheduled-for 这 两 个 联系 推导 出 来 。 辐 样 ， 参 与 也 是 可 从 其 他 角色 导出 的 角色 。 


{age = currentDate — dateOfBirth} 


Student Course Course 
Offering 
name * Registers-for * Em * Scheduled-for 1| crseCode 


ssn i term crseTitle 


dateOfBirth section creditHrs 
/age 


“| /participants 





/Takes 
图 14-8 导出 属性 、 关 联 和 角色 


14.4.6 ”表示 概 化 

第 4 章 已 介绍 过 概 化 和 特 化 的 概念 。 使 用 扩展 的 ER 模型 ， 我 们 已 经 学 习 了 怎样 把 两 个 或 多 
个 实体 的 公共 属性 以 及 这 些 实体 参与 的 公共 联系 抽象 成 更 一 般 的 实体 超 类 型 ， 同 时 把 不 是 公共 
的 属性 和 联系 仍 留 在 本 身 的 实体 ( 子 类 型 ) 中 。 在 面向 对 象 模型 中 ,我 们 可 以 利用 这 些 表示 法 ， 
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但 有 一 点 不 同 。 在 将 一 个 对 象 类 集 概 化 成 更 一 般 的 类 时 ， 我 们 不 仅 要 抽象 公共 的 属性 和 联系 ， 
还 要 抽象 公共 的 操作 。 一 个 类 的 属性 和 操作 被 称 为 类 的 特性 。 被 概 化 的 类 称 为 子 类 ， 而 概 化 后 
的 类 称 为 超 类 ， 这 与 EER 图 中 的 超 类 型 和 子 类 型 完全 对 应 。 

考察 图 14-9a 的 例子 (参见 图 4-8 中 相应 的 EER 图 )。 有 三 种 员工 : 钟点 工 、 受 薪 员 工 和 顾问 。 
所 有 员工 都 共享 的 特性 有 empName、empNumber、address、dateHired 和 printLabel， 这 些 属性 
都 存储 在 Employee 超 类 中 ， 而 特定 员工 特有 的 特性 存储 在 相应 的 子 类 中 (例如 Hourly 
Employee 的 hourlyRate 和 computeWages)。 在 表示 概 化 路 径 时 ， 从 子 类 到 超 类 画 一 条 实 线 ， 在 
超 类 的 一 端 画 一 个 带 空心 的 三 角形 (指向 超 类 )。 也 可 以 将 给 定 超 类 的 一 组 概 化 路 径 表 示 成 一 
棵 与 各 个 子 类 相连 接 的 多 分 支 树 ， 共 享 部 分 用 指向 超 类 的 空心 三 角形 表示 。 例 如 ， 在 图 14-9b 
(对 应 图 4-3) 中 ， 从 Outpatient 到 Patient 和 从 Resident Patient 到 Patient 的 两 条 概 化 路 径 合并 成 带 
指向 Patient 的 三 角形 的 共享 部 分 。 我 们 还 可 以 指定 这 个 概 化 是 动态 的 ， 表 示 一 个 对 象 有 可 能 改 
变 子 类 型 。 






Employee 






empName 
empNumber 
address 
dateHired 


printLabel( ) 
4 


-+-----~---~---- {disjoint, incomplete} 
Hourly Salaried 
Employee , Employee 
hourlyRate annualSalary contractNumber 
stockOption bilingRate 
computeFees( ) 


computeWages{ ) contributePension( ) 


a) 带 有 一 个 子 类 的 Employee 超 类 
physicianID 
physicianName 


































Patient 
{abstract} 。 
patientID 
admitDate 






Treated-by 1 












Bed 
Assigned-to 1 


b) 带 有 两 个 子 类 的 抽象 Patient 类 
图 14-9 概 化 、 继 承 和 约束 的 例子 
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可 以 在 路 径 旁 设置 一 个 鉴别 符 ， 指 出 概 化 的 基础 。 鉴 别 符 (对 应 于 第 4 章 中 定义 的 子 类 型 
鉴别 符 ) 指出 通过 特定 的 概 化 联系 抽象 出 对 象 类 的 哪 一 个 特性 (Rumbaugh 等 ，1991 )。 每 次 只 
能 鉴别 一 个 特性 。 例 如 ， 在 图 14-9a 中 ， 可 以 根据 员工 类 型 (小时工 、 受 薪 员 工 、 顾 癌 ) 鉴别 
出 员工 类 。 为 了 鉴别 图 14-9b 中 的 一 组 概 化 联系 ， 只 需 指定 一 次 鉴别 符 。 虽 然 可 以 把 patient 类 
分 成 Dutpatient 和 Resident Patient 两 个 子 类 ,但 是 基于 是 否 住 院 ， 在 共享 线 旁 边 只 需 显示 一 次 鉴 
别 符 标 号 。 

子 类 的 实例 也 是 其 超 类 的 实例 。 例如， 在 图 14-9b 中 ，Outpatient 实 例 也 是 一 个 Patient 的 实例 。 
因此 ， 概 化 称 为 一 个 Is-a 联 系 。 而 且 ， 子 类 继承 了 其 超 类 的 所 有 特性 。 在 图 14-9a 中 ，Hourly 
Employee 子 类 除了 它 自己 特性 hourlyRate 和 computeWages 以 外 ， 还 从 Employee 类 中 继承 了 
empName、empNumber、address、dateHired 和 printLabel 等 属性 。Hourly Employee 的 实例 将 存储 
Employee 和 Hourly Employee 的 属性 值 ， 在 需要 时 ， 也 可 使 用 printLabel 和 computeWages 操 作 。 

概 化 和 继承 可 以 在 超 类 / 子 类 层次 结构 中 的 不 同等 级 间 转 化 的 。 例 如 ，Consultant 有 一 个 子 
类 Computer Consultant (计算 机 顾问 ) ， 这 个 子 类 继承 了 Employee 和 Consultant 的 特性 。 
Computer Consultant 的 实例 也 是 Consultant 的 一 个 实例 ， 因 此 也 是 Employee 的 一 个 实例 。 
Employee 是 Computer Consultant 的 祖先 ， 而 Computer Consultant 是 Employee 的 子孙 。 使 用 这 些 
术语 是 因为 类 的 概 化 是 跨越 多 个 层次 而 实现 的 (Rumbaugh 等 ，1991)。 

继承 是 面向 对 象 模型 的 另 一 个 主要 优点 。 继 承 可 以 使 代码 具有 重用 性 ， 即 程序 员 不 必 编 写 
已 在 超 类 中 编写 过 的 代码 。 程 序 员 只 须 编写 对 那些 已 存在 类 的 新 的 、 被 精炼 的 子 类 来 说 具有 惟 
一 性 的 代码 。 实 际 上 ， 面 向 对 象 程序 员 们 先 要 访问 他 们 各 自 的 领域 中 的 大 型 类 库 ， 从 这 些 类 库 
中 找到 可 以 被 重用 、 被 精 化 的 类 以 满足 新 应 用 的 需求 。 支 持 面向 对 象 模型 的 人 声称 代码 的 可 重 
用 性 可 将 生产 率 提高 几 个 数量 级 。 

注意 ， 图 14-9b 中 Patient 类 是 斜体 的 ， 这 表示 它 是 一 个 抽象 类 (abstract class ) 。 抽象 类 是 一 
种 没有 直接 实例 ， 但 它 的 子孙 可 以 有 直接 实例 的 类 (Booch，1994; Rumbaugh 等 ，1991)。 注 
意 ， 也 可 以 在 类 名 下 面 用 一 对 花 括号 ， 在 括号 中 写 上 abstract 字 样 。 这 在 手工 生成 类 图 时 特别 
有 用 。 一 个 类 也 可 有 直接 的 实例 (例如 Outpatient 或 Resident Patient)， 这 样 的 类 称 为 具体 类 
(concrete class )。 在 这 个 例子 中 ， Outpatient 和 Resident Patient 都 可 以 有 直接 实例 ， 但 Patient 没 
有 它 自己 直接 的 实例 。 

Patient 抽 象 类 参与 了 一 个 与 Physician 类 有 关 的 联系 Treated-by， 这 个 联系 表示 所 有 的 病人 
(包括 门诊 病人 和 住院 病人 ) 都 要 由 医生 来 治疗 。Resident Patient 类 除了 这 个 继承 的 联系 外 ， 
还 有 它 自 己 专 有 的 与 Bed 类 相关 的 联系 ， 这 个 联系 称 为 Assigned-to ， 这 表示 住院 病人 都 被 分 配 
了 某 张 病床 。 这 样 ， 子 类 不 仅 要 精 化 类 的 属性 和 操作 ， 还 要 特 化 它 参 与 的 联系 。 

在 图 14-9a 和 14-9b 中 , “complete"”、“incomplete” 和 “disjoint” 放 在 花 括 号 内 ， 与 概 化 相 
邻 。 这 些 词 表 示 子 类 之 间 的 语义 约束 (complete 对 应 于 BER 表 示 法 中 的 完全 特 化 ， 而 
incomplete 相 应 于 部 分 特 化 )。 在 UML 中 ， 用 过 号 隔 开 的 关键 字 表 可 像 图 14-9b 那 样 放 在 共享 的 
三 角形 旁边 ， 也 可 像 图 14-9a 那 样 放 在 与 所 有 概括 线 相交 的 虚线 旁边 (LAML Norarion Guide, 
1997)。 可 使 用 下 列 UML 关 键 字 : overlapping、 disjoint、complete 和 incomplete。 根 据 UML 
Notation Guide (1997)， 这 些 术 语 的 意义 如 下 所 述 : 

“overliappings〈 重 登 ): 子孙 可 以 由 多 个 子 类 转变 而 成 《与 EER 图 形 表 示 法 中 的 重合 规则 一 

样 )。 

“disjoint (不 相交 ): 子孙 不 可 以 由 多 个 子 类 转变 而 来 (与 EER 图 形 表 示 法 中 的 不 相交 规则 

一 样 )。 
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。Complete (完备 ): 必须 指定 所 有 子 类 (不 管 是 否 标 出 )。 不 期 望 有 其 他 的 子 类 (与 EER 

图 形 表示 法 中 的 完全 特 化 规则 一 样 ) 。 

*，incomplete ( 非 完备 ): 某 些 子 类 被 指定 ， 然 而 是 不 完全 的 。 有 些 子 类 在 模型 中 未 出 现 

(与 EER 图 形 表示 法 中 的 部 分 特 化 规则 一 样 ) 。 

在 图 14-9a 和 14-9b 中 的 概 化 都 是 不 相交 的 。 一 个 员工 可 以 是 一 个 小 时 工 、 受 薪 员 工 或 顾问 ， 
但 不 可 以 同时 兼任 ， 例 如 同时 既是 受 薪 员 工 又 是 顾问 。 同 样 ， 一 个 病人 可 以 是 一 个 门诊 病人 或 
住院 病人 ， 但 不 可 能 同时 是 两 者 。 图 14-9a 中 的 概 化 是 非 完备 的 (与 图 4-8 中 的 显示 相 违 背 的 )， 
表示 一 个 员工 可 以 不 属于 这 三 种 类 型 中 的 任何 一 种 。 此 时 ， 这 个 员工 可 以 作为 具体 类 Employee 
的 实例 存储 。 相 反 ， 图 14-9b 中 的 概 化 是 完备 的 ， 表 示 一 个 病人 必须 是 门诊 病人 或 住院 病人 ， 
不 能 有 其 他 类 型 。 因 此 ，Patient 被 指定 为 一 个 抽象 类 。 

图 14-10 是 一 个 重合 约束 的 例子 。 这 个 图 表示 科研 助教 和 教学 助教 都 是 研究 生 。 重 又 约束 
表示 一 个 研究 生 可 能 既是 科研 助教 又 是 教学 助教 。 例 如 ， 研 究 生 Sean Bailey 每 周 要 花 12 小 时 担 
任 科研 助教 ， 要 花 8 小 时 担任 教学 助教 。 还 要 注意 ，Graduate Student 应 指定 成 具体 类 ， 以 便 表 
示 不 担任 助教 的 研究 生 。“level” 览 别 符 的 概 化 线 下 面 的 省 略 号 (…) 不 表示 非 完备 约束 。 它 
表示 图 中 未 标 出 的 模型 的 其 他 子 类 。 例 如 ， 虽 然 模型 中 有 Undergrad Student (本 科 生 ), 但 由 
于 重点 是 在 助教 方面 ， 因 此 该 子 类 在 图 中 省 略 了 。 还 可 以 在 空间 有 限时 使 用 省 略 号 。 
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图 14-10 重合 约束 的 例子 


图 14-11 表 示 了 在 为 学 生 记 账 建 模 开发 的 模型 中 表示 的 研究 生 和 本 科 生 。calc-tuition 操 作用 
于 计算 一 个 学 生 应 该 付 的 学 费 ， 这 个 总 和 取决 于 每 贷款 小 时 的 学 费 (tuitionPerCred )、 选 修 的 
课程 以 及 每 一 门 课程 的 贷款 学 时 数目 (credtHrs )。 每 贷款 小 时 的 学 费 还 取决 于 学 生 是 研究 生还 
是 本 科 生 。 在 这 个 例子 中 ,研究 生 的 贷款 小 时 学 费 是 $300， 而 所 有 本 科 生 的 贷款 小 时 学 费 是 
$250。 应 指出 ， 用 下 划 线 标 出 了 两 个 子 类 的 tuitionPerCred 属 性 与 它 的 值 。 这 样 的 属性 称 为 类 范 
围 属性 (class-scope attribute )， 指 定 一 个 值 在 整个 类 中 都 应 一 样 ， 而 不 必 为 每 个 实例 去 指定 一 
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个 值 (Rumbaugh 等 ，1991)。 
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图 14-11 多 态 、 抽 象 操作 、 类 范围 属性 和 排序 


也 可 以 在 属性 名 后 使 用 “=” 号 来 指定 一 个 属性 的 初始 默认 值 。 这 是 新 创建 的 对 象 实例 的 
初始 属性 值 。 例 如 ， 在 图 14-11 中 ，creditHrs 属 性 的 初始 值 为 3， 表 示 在 创建 新 的 Course 实 例 时 ， 
其 creditHrs 值 被 置 为 默认 值 3。 通过 编写 一 个 显 式 的 构造 器 操作 可 以 修改 初始 的 默认 值 。 也 可 
以 在 以 后 通过 其 他 操作 来 修改 这 个 值 。 初始 值 规范 与 类 范围 属性 之 间 的 区 别 在 于 前 者 允许 类 的 
实例 有 不 同 的 属性 值 ， 而 后 者 强制 所 有 实例 共享 一 个 共同 的 值 。 

除了 指定 关联 角色 的 多 重 性 以 外 , 还 可 以 指定 其 他 性 质 。 例 如 起 该 作用 的 对 象 是 否 排序 等 。 
在 图 中 ，Scheduled-for 联 系 的 Course Offering 端 放置 了 关键 字 约 束 “{ordered}” ， 用 来 表示 对 于 
给 定 课程 的 设置 被 排序 成 表 ， 例 如 根据 学 期 和 班级 来 排序 。 很 显然 ， 在 角色 的 多 重 性 大 于 1 时 ， 
排序 是 有 意义 的 。 在 一 个 角色 上 默认 的 约束 是 “{unordered}”"。 也 就 是 说 ， 如 果 在 角色 边 不 指 
定 关键 字 “{ordered}”， 那 么 假定 有 关 的 元 素 形成 一 个 未 排序 的 集合 。 例 如 ， 课程 设置 与 学 生 
无 关 ， 学 生 能 以 任何 顺序 来 注册 设置 的 课程 。 

Graduate Student 子 类 通过 添加 四 个 属性 和 精 化 继承 的 calc-tuition 操 作 特 化 了 抽象 的 Student 
类 ， 这 四 个 属性 是 undergradMajor、greScore、 gmatScore 和 tuitionPerCred。 注 意 ，calc-tuition 
操作 在 Student 类 中 用 斜体 表示 ， 这 意味 着 该 操作 是 一 个 抽象 的 操作 。 抽象 操作 (abstract 
operation ) 定义 了 操作 的 形式 或 协议 ， 但 不 是 它 的 实现 (Rumbaugh 等 ，1991 )。 在 本 例 中 ， 
Student 类 定义 了 calc-tuition 操 作 的 协议 , 但 是 不 必 提 供 相应 方法 (method， 操 作 的 实际 实现 )。 
协议 包含 了 参数 的 数目 和 类 型 、 结果 类 型 和 操作 的 预期 的 语义 。 这 两 个 具体 子 类 Graduate 
Student 和 Undergrad uate Student 提 供 了 calc-tuition 操 作 本 身 的 实现 。 注 意 ， 由 于 这 些 类 是 具体 
的 ， 因 此 它们 不 能 存储 抽象 操作 。 

还 应 指出 ， 虽 然 Graduate Student 和 Undergraduate Student 类 共享 同 一 个 calc-tuition 操 作 ， 但 
它们 可 能 以 不 同 的 方式 实现 这 个 操作 。 例 如 ， 对 研究 生来 说 ， 实 现 这 个 操作 的 方法 可 能 是 对 研 
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究 生 每 选修 一 门 课程 就 要 添加 一 个 专门 的 研究 生 费 用 。 同 样 的 操作 可 以 以 不 同方 式 应 用 到 两 个 
或 多 个 类 上 的 现象 称 为 多 态 (polymorphism)， 多 态 是 面向 对 象 系统 中 的 关键 概念 (Booch， 
1994; Rumbaugh 等 ，1991)。 图 14-11 中 的 enrollment 操 作 是 多 态 的 另 一 个 例子 。Course 
Offering 中 的 enrollment 操 作 计 算 特 定 的 课程 设置 或 班级 的 注册 人 数 时 ， 在 Course 之 中 的 同名 操 
作 也 计算 给 定 课程 的 所 有 班级 的 注册 人 数 。 

14.4.7 解释 继承 和 重 载 

我 们 已 经 看 到 ， 一 个 子 类 怎样 增加 从 它 祖先 那里 继承 的 特性 。 此 时 ， 称 子 类 使 用 了 扩展 的 
继承 。 另 一 方面 ， 如 果 一 个 子 类 约束 了 祖先 的 属性 或 操作 ， 那 么 称 子 类 使 用 了 约束 的 继承 
(Booch，1994; Rumbaugh 等 ，1991)。 例如， 名 为 Tax-Exempt Company 的 子 类 可 以 取消 或 屏 
项 从 其 超 类 Company 继 承 的 操作 compute-tax。 

一 个 操作 的 实现 可 以 是 重 载 的 。 重 载 (overriding ) 是 用 子 类 中 更 特定 的 方法 的 实现 来 替 
换 从 超 类 中 继承 的 方法 的 过 程 。 重 载 的 原因 涉及 扩展 、 约 束 和 优化 《Rumbaugh 等 ，1991)。 新 
操作 的 名 字 和 所 继承 的 操作 的 名 字 相 同 ， 但 必须 在 子 类 中 明确 指出 这 个 操作 是 重 载 的 。 

在 扩展 重 载 中 ， 通 过 加 入 某 些 行为 (代码 ) 扩展 子 类 从 超 类 继承 的 操作 。 例 如 ，Foreign 
Company 是 Company 的 一 个 子 类 ， 它 继承 了 称 为 compute-tax 的 操作 ， 但 通过 加 入 外 国 增 付 费用 
来 计算 总 的 税额 而 扩展 了 继承 的 行为 。 

在 约束 重 载 中 ， 子 类 中 新 操作 的 协议 是 受 约束 的 。 例 如 ，Student 中 有 一 个 称 为 place-student 
(job) 操作 ， 在 其 子 类 International Student 中 通过 对 参数 job 限制 而 受到 了 约束 (参见 图 14-12)。 
一 般 的 学 生 在 夏季 可 安排 所 有 类 型 的 工作 ， 而 留学 生 由 于 受到 限制 只 能 从 事 校 园 内 的 工作 。 新 
的 操作 通过 对 job 参数 加 以 限制 重 载 了 继承 的 操作 ， 限 制 job 值 只 能 是 所 有 可 能 工作 的 一 个 比较 
小 的 子 集 。 这 个 例子 还 说 明了 多 个 鉴别 符 的 使 用 方法 。 在 概 化 集 的 基础 是 学 生 的 “level” (研究 
生 或 本 科 生 ) 时 ， 另 一 个 概 化 集 的 基础 是 他 或 她 的 “residency” 状 态 (美国 的 或 外 国 的 )。 
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图 14-12 重 载 继 承 


在 优化 重 载 中 ， 通 过 利用 由 子 类 拥有 的 约束 ， 新 操作 与 改进 的 代码 一 起 实现 。 例 如 ， 称 为 
Deans List Student 的 Student 的 子 类 表示 所 有 处 于 Dean's List 中 的 学 生 。 为 了 有 资格 进入 Dean'’s 
List， 学 生 的 绩 点 平均 值 必须 大 于 等 于 3.50。 假 设 Student 有 一 个 操作 mailScholApps， 该 操作 把 
优等 和 中 等 奖学金 发 给 绩 点 平均 值 大 于 等 于 3.00， 并 且 家 庭 总 收入 低 于 20 000 美 元 的 学 生 。 
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Student 中 这 个 操作 的 方法 必须 检查 这 个 条 件 。 田 一 方面 ，Dean's List Studen 子 类 中 同样 操作 的 
方法 通过 从 源 代码 中 消除 第 一 个 条 件 而 改进 执行 的 速度 。 考 虑 称 为 findMinGpa 的 另 一 个 操作 ， 
该 操作 在 学 生 之 间 找 最 小 的 绩 点 平均 值 (8pa)。 假 定 Dean's List Student 类 以 gpa 升 序 方式 排序 ， 
但 Student 类 不 是 这 样 。Student 中 findMinGpa 的 方法 必须 在 所 有 学 生 中 执行 顺序 搜索 。 相 比 之 
下 ，Dean's List Student 中 的 同样 操作 可 以 用 列表 中 检索 第 一 个 学 生 的 gpa 的 方法 实现 ， 因 此 不 
再 需要 费时 的 搜索 。 

14.4.8 表示 多 重 继承 

前 面 已 研究 了 单 重 继承 ， 即 一 个 类 只 从 一 个 超 类 处 继承 。 正 如 在 科研 助教 和 教学 助教 的 例 
子 中 看 到 的 那样 ， 有 了 时 一 个 对 象 可 能 是 多 个 类 的 实例 。 这 种 情况 称 为 多 重 分 类 (multiple 
classification， 参 见 Fowler，1997; UML Noration Guide ，1997 )。 例 如 ，Sean Bailey 是 具有 两 
种 身份 的 助教 ， 他 有 两 个 类 别 : 一 个 是 Research Assistant 的 实例 ， 另 一 个 是 Teaching Assistant 
的 实例 。 但 是 专家 不 主张 使 用 多 重 分 类 。 普 通 的 UML 语 义 和 许 多 面向 对 象 语 言 都 不 支持 多 重 
分 类 。 

为 了 避免 这 个 问题 ， 可 以 使 用 多 重 继承 ， 该 方法 允许 一 个 类 从 多 个 超 类 那里 继承 特性 。 例 
如 ， 在 图 14-13 中 ， 可 创建 Research&Teaching Assistant 类 ， 它 既是 Research Assistant 也 是 
Teaching Assistant 的 子 类 。 既 是 科研 助教 又 是 教学 助教 的 学 生 可 以 存储 在 这 个 新 类 下 。 现 在 可 
以 把 Sean Bailey 表 示 成 属于 Research&Teaching Assistant 类 的 一 个 对 象 ， 它 从 两 个 父亲 那里 继承 
了 特性 ， 例 如 从 Research Assistant 那 里 继承 了 researchHrs 和 assisgnProject (proj) 属性 ， 并 且 从 
Teaching Assistant 那 里 继承 了 teachingHrs 和 assignCourse (crse) 属性 。 
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图 14-13 多 重 继承 


14.4.9 表示 聚合 
聚合 (aggregation) 表示 了 组 件 对 象 和 聚合 对 象 之 间 的 Part-of ( 一部分) 联系。 这 是 一 种 
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较 强 形式 的 关联 联系 (具有 附加 的 “part-of” 语 义 )， 在 聚合 的 一 端 用 空 的 菱形 表示 。 例 如 在 
图 14-14 中 ， 个 人 计算 机 是 CPU (多 处 理 器 可 达 4 个 )、 硬 盘 、 显 示 器 、 键 盘 和 其 他 对 象 的 聚合 。 
注意 ,聚合 涉及 一 组 不 同 对 象 实例 ， 每 个 聚合 包含 了 其 他 实例 ， 或 由 其 他 实例 组 合 而 成 。 例 如 ， 
Personal Computer 对 象 与 CPU 对 象 有 关 ，CPU 对 象 是 Personal Compnuter 对 象 的 一 部 分 。 相 比 之 
下 ， 概 化 与 对 象 类 有 关 ， 即 一 个 对 象 (例如 Mary Jones) 同时 也 是 它 所 在 类 (例如 Undergrad 
Student) 的 一 个 实例 ,以 及 它 的 超 类 (例如 Student) 的 一 个 实例 。 只 有 一 个 对 象 (例如 Mary 
Jones) 包含 在 概 化 联系 中 。 这 就 是 为 什么 在 聚合 线 的 端点 处 要 指出 多 重 性 ， 而 概 化 联系 中 不 


必 指 出 多 重 性 的 原因 。 
1.4 1 1 1 
图 14-14 聚合 的 例子 


图 14-1$a 表 示 了 大 学 的 究 合 结构 。 图 14-15b 的 对 象 图 表示 University 的 对 象 实例 Riverside 
University 怎 样 与 它 的 组 件 对 象 (表示 它 的 管理 单位 ， 例 如 Admissions、Human Resources 等 ) 
和 学 院 ( 例 如 Arts&Science、Business 等 ) 联系 。 一 个 学 院 对 象 (例如 Business) 也 可 由 几 个 系 
对 象 组 成 (例如 Accounting、Finance 等 )。 

注意 ， 在 Building 和 Room 之 间 联 系 的 一 端的 葵 形 不 是 空心 的 ， 而 是 实心 的 。 实 心 的 萎 形 表 
示 一 种 较 强 形式 的 聚合 ， 称 为 复合 (Fowler，2000; UML Notation Guide，1997)。 在 复合 
(composition) 中 ， 一 部 分 对 象 只 属于 一 个 整体 对 象 。 例 如 ， 一 个 房间 只 是 一 幢 大 楼 中 的 一 部 
分 。 因 此 ， 诊 合 端的 多 重 性 可 以 超过 1。 部 分 可 以 在 创建 整个 对 象 后 才 创 建 。 例 如 ， 房间 可 以 
-附加 到 已 存在 的 大 楼 中 。 但 是 ， 一 旦 创建 复合 的 一 部 分 以 后 ， 这 一 部 分 就 与 整体 共存 广 ; 删除 
聚合 对 象 会 将 它 的 组 件 一 起 删除 。 如 果 一 峡 大 楼 被 摧毁 ， 那 么 所 有 房间 也 随 之 消失 。 但 是 ,在 
罕 合 删除 前 就 有 可 能 将 其 中 一 部 分 删 掉 ， 就 像 没 有 摧毁 大 楼 但 却 摧毁 一 个 房间 。 

考虑 另 一 个 聚合 例子 ， 即 在 第 3 章 就 已 提 到 的 材料 单 结构 。 许多 制造 出 的 产品 由 部 件 制 成 ， 
这 些 部 件 又 由 子 部 件 和 零件 组 成 ， 等 等 。 我 们 已 看 到 ， 在 ER 图 (参见 图 3-13) 中 这 种 类 型 的 
结构 可 以 表示 成 多 对 多 的 一 元 联系 〈 称 为 Has_components )。 若 联系 也 有 它 自 己 的 属性 ， 例 如 
Quantity， 那 么 联系 也 可 以 转换 成 一 个 关联 实体 。 虽 然 材料 单 结构 本 质 上 是 一 种 聚合 ， 但 由 于 
BER 模 型 在 语义 上 不 支持 较 强 的 聚合 概念 ， 因此 只 能 将 该 结构 表示 成 一 个 关联 。 在 面向 对 象 模 
型 中 ， 我 们 能 明确 地 显示 这 个 聚合 。 

图 14-16 表 示 了 材料 单 结构 。 为 了 区 别 部 件 和 元 件 (不 能 再 分 )， 我 们 创建 两 个 类 Assembly 
和 Simple Part， 这 两 个 类 都 是 Part 类 的 子 类 。 这 个 图 表示 一 个 产品 由 多 个 零件 组 成 ， 而 零件 本 
身 又 是 由 其 他 零件 组 成 ， 等 等 ; 这 是 一 个 递归 聚合 的 例子 。 由 于 Part 被 表示 成 抽象 类 ， 因 此 一 
个 零件 可 以 是 一 个 部 件 也 可 以 是 一 个 元 件 。 一 个 Assembly 对 象 是 Part 超 类 的 实例 的 聚合 ， 表 示 
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它 由 其 他 部 件 ( 可 选择 的 ) 和 元 件 组 合 而 成 的 。 注 意 ， 我 们 可 以 轻松 地 捕捉 附加 到 聚合 联系 的 
关联 类 的 属性 ， 如 一 个 组 件 中 零件 的 数量 。 
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b) 对 象 图 
图 14-15 聚合 和 复合 


在 不 能 确定 两 个 对 象 之 间 的 联系 是 一 个 关联 还 是 一 个 聚合 时 ， 应 弄 清楚 一 个 对 象 是 否 真正 
是 另 一 个 对 象 的 一 部 分 。 也 就 是 说 ， 存 在 整体 /部 分 联系 吗 ? 注意 ， 一 个 聚合 不 一 定 表示 物理 
包含 ， 例 如 Personal Computer 和 CPU。 整 体 /部 分 联系 可 以 是 概念 性 的 ， 例 如 组 合 基金 和 属于 该 
基金 的 一 部 分 的 股票 之 间 的 联系 。 在 聚合 中 ， 可 能 存在 (也 可 能 不 存在 ) 独立 于 聚合 对 象 的 对 
象 。 例 如 ， 一 个 股票 是 否 存在 与 它 是 否 是 组 合 基金 的 一 部 分 无 关 ， 而 一 个 部 门 的 不 存在 也 与 一 
个 组 织 无 关 。 而 且 ， 一 个 对 象 可 能 是 几 个 聚合 对 象 的 一 部 分 (例如 许多 组 合 基金 可 以 包含 IBM 
股票 )。 但 是 应 记 住 ， 在 聚合 中 ， 复 合 不 允许 一 个 对 象 是 多 个 聚合 对 象 的 一 部 分 ， 

聚合 的 另 一 个 特点 是 整体 上 的 某 些 操作 可 自动 地 应 用 于 它 的 部 分 上 。 例 如 ， 在 Personal 
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Computer 对 象 类 上 有 一 个 称 为 ship (发 货 ) 的 操作 ， 它 也 可 以 应 用 于 CPU、Hard Disk 和 
Monitor 等 ， 这 是 因为 只 要 计算 机 发 货 ， 其 零件 也 随 之 发 送出 去 。 也 可 以 说 ， 在 Personai 
Computer 上 的 ship 操 作 被 传播 到 它 的 零件 (Rumbaugh 等 ，1991 )。 


<> 
1 . ud 
Ed Part 
{abstract} 
pa 
Assembly 


图 14-16 递归 聚合 








14.5 业务 规则 


在 第 3 和 第 4 章 就 曾 详 细 地 讨论 过 业务 规则 。 前 面 已 讨论 过 怎样 用 ER 图 表示 不 同类 型 的 规 
则 。 在 本 章 的 例子 中 ， 我 们 已 看 到 许多 业务 规则 ， 隐 式 或 显 式 地 作为 类 、 实 例 、 属 性 、 操作 和 
联系 等 的 约束 。 例 如 ， 怎 样 在 关联 角色 上 确定 基数 约束 和 排序 的 约束 。 还 看 到 怎样 在 子 类 之 间 
表示 语义 约束 (例如 重 倒 、 不 相交 等 )。 本 章 已 讨论 过 的 许多 约束 在 使 用 时 都 用 到 了 花 括号 ， 
其 中 包含 UML 关 键 字 ， 例 如 {disjoint，complete} 和 {ordered}， 它们 被 放 在 使 用 约束 的 元 素 的 旁 
边 。 例 如 图 14-11 中 表示 了 对 给 定 课程 排序 的 业务 规则 。 但 是 如 果 你 使 用 预定 义 的 UML 约 束 不 
能 表示 一 个 业务 规则 ， 那么 你 可 以 用 英语 或 形式 逻辑 那样 的 语言 来 定义 规则 。 

在 确定 涉及 到 两 个 图 形 符号 (例如 表示 两 个 类 或 两 个 关联 ) 的 业务 规则 时 ， 可 以 用 从 一 个 
元 素 到 另 一 个 元 素 的 虚线 箭头 表示 ， 并 在 花 括号 中 标 上 约束 名 来 表示 (DAML Notation Guide， 
1997)。 图 14-17 表 示 这 样 一 个 业务 规则 : 系 主任 必须 是 系 中 的 一 个 成 员 ， 这 是 通过 指定 Chair- 
of 关联 是 Member-of 关 联 的 子 集 实现 的 。 

当 业 务 规则 涉及 到 三 个 或 更 多 的 图 形 符号 时 ， 可 以 用 一 个 注释 表示 这 个 约束 ， 并 把 这 个 注 
释 用 虚线 连 到 每 个 符号 上 (UML Notation Guide， 1997)。 图 14-17 表 示 了 这 样 一 个 业务 规则 : 
“被 指派 教 一 门 课程 的 某 个 班级 的 教师 必须 有 资格 教授 这 门 课程 ”, 并 且 该 规则 标记 在 注释 符号 
中 。 由 于 这 个 约束 涉及 到 这 三 个 关联 联系 ， 因此 要 把 注释 连接 到 这 三 个 关联 路 径 上 去 。 


14.6 对 象 建 模 实例 : 松 谷 家 具 公司 


在 第 3 章 ， 我 们 已 学 过 怎样 开发 松 谷 家 具 公司 的 高 级 ER 图 (参见 图 3-22)。 通过 对 公司 业务 
过 程 的 研究 ， 确 定 了 实体 类 型 、 键 和 其 他 重要 属性 。 现在 说 明 如 何 使 用 面向 对 象 模型 来 开发 同 
样 应 用 的 类 图 。 类 图 在 图 14-18 中 表示 。 我 们 讨论 这 张 类 图 和 ER 图 之 间 的 相同 和 不 同 之 处 。 
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图 14-17 表示 业务 规则 


正如 期 望 的 那样 ， 实 体 类 型 表示 成 对 象 类 ， 所 有 属性 都 在 类 中 表示 。 但 是 应 注意 ， 不 能 用 
主键 形式 来 表示 显 式 标识 符 ， 这 是 因为 根据 定义 ， 每 一 个 对 象 有 它 自 己 的 标识 。 由 于 ER 模型 
以 及 关系 数据 模型 (参见 第 5 章 ) 没有 其 他 支持 标识 的 概念 ， 因 此 需要 显 式 地 说 明 标识 符 。 在 
面向 对 象 模型 中 ， 应 该 表示 的 标识 符 是 现实 世界 中 有 意义 的 属性 ， 例 如 salespersonID、 
customerID、orderID 和 productID， 这 些 在 类 图 中 都 表示 成 键 。 注 意 ， 在 Product Line 中 未 标 出 
标识 ， 因 为 假定 Product_Line_ID 被 作为 内 部 标识 符 包 含 在 ER 图 中 ， 而 不 是 像 orderID 或 
productID 那 样 作为 现实 世界 属性 。 如 果 松 谷 家 具 公 司 实际 上 不 使 用 vendorID 或 任何 其 他 属性 来 
支持 它 的 业务 处 理 ， 那 么 在 类 图 中 就 不 包含 这 个 属性 。 为 此 ， 也 不 必 为 Vendor、Order Line 和 
Skill 等 类 标 出 标识 符 。 

在 ER 图 中 ,“Skill” 是 Employee 的 多 值 属性 。 在 类 图 中 ，Skill 被 表示 成 独立 的 对 象 类 ， 这 
是 因为 根据 Fowler (2000) 的 观点 ， 在 概念 面向 对 象 模 型 中 ， 一 个 属性 总 是 应 该 是 单 值 的 。 
Order Line 被 表示 成 一 个 关联 类 ， 即 “Supplies”。 在 类 符号 中 显示 Order Line 联 系 的 名 称 来 强调 
“类 本 质 ” 时 ， 可 以 在 关联 路 径 上 显示 Supplies 关 联 的 命名 来 强调 它 的 “关联 本 质 ”。 

图 14-18 的 类 图 揭示 了 用 操作 表示 的 处 理 ， 而 这 些 处 理 在 ER 图 中 是 无 法 表示 的 。 例 如 ， 
Customer 有 一 个 mailInvoice 操 作 ， 在 执行 时 ， 把 发 货 单 邮 寄 给 已 发 出 订单 的 顾客 ， 并 以 美元 为 
单位 说 明 订单 总 额 ， 并 根据 这 个 数量 增加 顾客 的 未 付款 的 额度 。 一 且 收 到 顾客 的 付款 后 ， 
receivePayment 根 据 收 到 的 数额 调整 这 个 额度 。 类 OrderLine 中 的 orderlineTotal 操 作 计算 给 定 订 
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单 的 某 一 行 总 的 美元 数 ， 而 Order 中 的 OrderTotal 操 作 计算 整个 订单 的 总 的 金额 (也 就 是 所 有 订 
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图 14-18 松 谷 家 具 公 司 的 类 图 


图 14-18 还 说 明了 多 态 。totalSales 操 作 在 类 Product 和 类 Product Line 中 都 出 现 过 ， 但 是 是 使 
用 两 种 不 同方 法 实现 的 。 在 Product 中 的 方法 计算 给 定 产品 的 总 的 销售 量 ， 而 ProductkLine 中 的 
方法 计算 属于 给 定 产品 系列 的 所 有 产品 的 总 销售 量 。 

totalSales 、totalCommission、orderTotal、 orderlineTotal 和 checkSkills 等 操作 都 是 查询 操作 ， 
这 是 因为 这 些 操 作 都 是 不 产生 副 面 影响 。 而 mailInvoice、 receivePaymt 和 assignProd 等 都 是 更 新 
操作 ， 因 为 这 些 操 作 修改 了 某 些 对 象 的 状态 。 例 如 ， assignProd 操 作 分 配 一 个 新 的 产品 给 
“line” 变量 指定 的 产品 系列 ， 因 而 改变 产品 (被 分 配 的 产品 ) 和 产品 系列 (包含 这 个 产品 的 产 
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品系 列 ) 的 状态 。 
本 章 小 结 


本 章 介绍 了 日 趋 流 行 的 面向 对 象 建 模 方法 ， 这 是 一 种 使 用 公共 的 基本 表示 方法 来 支持 现实 
世界 应 用 的 有 效 表 示 ， 其 中 包括 数据 和 处 理 两 个 方面 。 本 章 描述 了 面向 对 象 开 发 生命 周期 的 不 
同 阶段 涉及 到 的 活动 ， 并 强调 了 面向 对 象 模型 在 从 分 析 、 设 计 到 实现 各 个 阶段 转化 的 无 颖 的 本 
质 , 这 与 其 他 建 模 方法 形成 了 鲜明 的 对 比 。 例 如 结构 化 分 析 和 设计 等 方法 缺少 公共 的 基本 表示 ， 
因此 在 转化 过 程 中 会 出 现 不 连续 和 不 相交 的 情况 。 

面向 对 象 建 模 是 一 个 高 级 概念 活动 , 特别 适用 于 数据 分 析 。 本 章 中 引入 了 对 象 和 类 的 概念 ， 
并 且 讨 论 了 对 象 标识 和 封装 。 本 章 还 开发 了 几 个 使 用 UML 表 示 法 的 类 图 来 说 明 怎 样 建 模 各 类 
情况 。 我 们 还 学 到 了 怎样 绘制 与 给 定 类 图 相对 应 的 对 象 图 。 对 象 图 是 类 图 的 一 个 实例 ， 提 供 了 
系统 在 某 时 间 点 上 存在 的 实际 的 对 象 和 链接 的 一 个 快照 。 

我 们 还 看 到 了 怎样 使 用 操作 来 为 基本 应 用 进行 建 模 的 处 理 。 操 作 有 三 种 类 型 : 构造 器 、 查 
询 和 更 新 。ER 模 型 (以 及 扩展 的 ER 模型 ) 不 能 应 用 这 些 处 理 ， 只 能 对 一 个 组 织 的 数据 需求 建 
模 。 本 章 强调 了 ER 模型 和 面向 对 象 模型 之 间 的 一 些 相似 性 ， 但 同时 也 强调 使 后 者 比 前 者 功能 
更 强大 的 特性 。 

我 们 还 看 到 了 在 类 图 中 怎样 表示 不 同 程度 的 关联 联系 一 一 一 元 联系 、 二 元 联系 和 三 元 联系 。 
一 个 关联 可 以 扮演 两 个 或 多 个 角色 ; 每 个 角色 有 一 个 多 重 性 ， 指 出 参与 该 联系 的 对 象 的 数目 。 
在 关联 角色 中 还 可 以 指定 其 他 约束 ， 如 形成 有 序 的 对 象 集 。 在 关联 本 身 具 有 自己 的 属性 或 操作 
时 ， 或 在 关联 参与 其 他 关联 时 ， 关 联 可 以 被 建 模 成 一 个 类 ， 这 样 的 类 称 为 关联 类 。 对 象 图 中 的 
链接 和 链接 对 象 分 别 与 类 图 中 的 关联 和 关联 类 相对 应 。 导 出 属性 、 导 出 联系 和 导出 角色 也 能 够 
在 类 图 中 表示 。 

与 扩展 ER 模型 中 的 超 类 型 和 子 类 型 类 似 ， 面 向 对 象 模型 使 用 超 类 和 子 类 表示 概 化 联系 。 
概 化 路 径 的 依据 可 以 用 紧 靠 概 化 路 径 的 鉴别 符 标号 来 表示 。 子 类 中 的 语义 约束 可 以 用 UML 关 
键 字 (overlapping、disjoint、complete 和 incomplete ) 来 指定 。 在 一 个 类 没有 任何 直接 的 实例 
时 ， 它 可 以 被 建 模 成 一 个 抽象 类 。 一 个 抽象 类 可 以 提供 一 个 抽象 操作 ， 但 这 个 操作 不 是 方法 。 

在 概 化 联系 中 ， 一 个 子 类 继承 它 的 超 类 的 特性 ， 并 利用 传递 性 继承 了 它 的 所 有 祖先 类 的 特 
性 。 在 面向 对 象 系统 中 继承 支持 代码 重用 ， 因 此 继承 是 一 个 功能 强大 的 机 制 。 我 们 还 讨论 了 使 
用 继承 特性 的 方法 ， 以 及 在 子 类 中 使 用 重 载 继承 操作 的 理由 。 我 们 还 介绍 了 面向 对 象 建 模 中 另 
一 个 关键 的 概念 一 一 多 态 ， 这 意味 着 一 个 操作 可 以 以 不 同方 式 使 用 在 不 同 的 类 上 。 面 向 对 象 奸 
模 中 的 封装 、 继 承 和 多 态 概念 可 以 使 系统 开发 者 利用 功能 强大 的 机 制 来 开发 复杂 的 、 健 壮 的 、 
灵活 的 和 可 维护 的 业务 系统 。 

面向 对 象 模型 支持 察 合 ， 而 ER 或 扩展 ER 模型 不 支持 聚合 。 聚 合 是 一 种 语义 比 关联 还 要 强 
的 形式 ， 表 示 组 件 对 象 和 聚合 对 象 之 间 的 part-of 联 系 。 我 们 对 聚合 和 概 化 加 以 区 分 ， 并 提供 了 
在 表示 联系 时 选择 关联 还 是 聚合 的 准则 。 我 们 还 讨论 了 比 聚 合 还 要 强 的 一 种 形式 ， 该 形式 称 为 
复合 。 复 合 中 每 一 部 分 对 象 属于 惟一 的 整体 对 象 ， 并 与 之 同 存亡 。 

本 章 还 阐述 了 在 类 图 中 怎样 隐 式 或 显 式 地 叙述 业务 规则 。UML 提 供 了 几 个 关键 字 ， 它 们 
可 用 于 对 类 、 属 性 、 联 系 等 的 约束 上 。 此 外 ， 也 可 以 使 用 用 户 定义 约束 来 表示 业务 规则 。 在 一 
个 业务 规则 涉及 到 两 个 或 多 个 元 素 时 ， 可 以 使 用 注解 符号 表示 类 图 中 的 规则 。 在 本 章 结束 时 ， 
通过 开发 松 谷 家 具 公 司 的 类 图 ， 说 明了 怎样 利用 面向 对 象 方法 来 建 模 现实 世界 业务 问题 的 数据 
和 处 理 。 
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本 章 复习 
关键 术语 
抽象 类 抽象 操作 聚合 
关联 关联 类 关联 角色 
行为 类 图 类 范围 属性 
复合 具体 类 构造 器 操作 
封装 方法 多 重 分 类 
多 重 性 对 象 对 象 类 (类) 
对 象 图 操作 重 载 
多 态 查询 操作 范围 操作 
状态 更 新 操作 
复习 问题 
1. 定义 下 面 每 一 个 术语 : 
a. 对 象 类 b. 状态 c. 行 为 
d. 封装 e. 操作 f. 方 法 
g. 构造 器 操作 h. 查询 操作 i. 更 新 操作 
j. 抽象 类 k. 具体 类 1. 抽象 操作 
m. 多 重 性 n. 类 范围 属性 0. 关联 类 
p. 多 态 q. 重 载 r. 多 重 分 类 
s. 复合 t. 递归 聚合 
2. 匹配 下 列 术 语 及 其 定义 : 
一 具体 类 a. 以 不 同方 式 使 用 的 操作 
”抽象 操作 b. 形式 ， 不 是 实现 
聚合 c. 直接 实例 
_  _ 重 载 d. 只 属于 一 个 完整 的 对 象 
多 态 e. 方法 替换 
一 关联 类 f. part-of 联 系 
复合 g. 一 组 对 象 
一 对象 类 h. 等 价 于 关联 实体 
3. 比较 下 列 术 语 
a. 类 ; 对 象 b. 属性 ; 操作 c. 状态 ; 行为 
d. 操作 ; 方法 c. 查询 操作 ; 更 新 操作 f. 抽象 类 ; 具体 类 
g. 类 图 ; 对 象 图 h. 关联 ; 察 合 i. 概 化 ; 聚合 
j. 聚合 | 复合 k. 扩展 的 重 载 ; 限制 的 重 载 


4. 试 叙述 在 面向 对 象 开发 生命 周期 的 以 下 三 个 阶段 涉及 到 的 活动 : 


面向 对 象 分 析 ， 面 向 对 象 设 计 ， 面 向 对 象 实现 
35. 试 比较 面向 对 象 模 型 和 扩展 的 ER 模型 。 


6. 试 叙述 将 一 个 关联 联系 建 模 成 一 个 关联 类 所 依据 的 条 件 。 
7 试用 类 图 来 说 明 下 面 的 联系 类 型 : 一 元 、 二 元 和 三 元 联系 。 说 明 这 些 联系 的 多 重 性 。 


8. 在 复习 问题 7 的 例子 中 ， 试 为 关联 联系 添加 角色 名 。 
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在 复习 问题 7 的 例子 中 ， 试 为 类 添加 操作 。 


10. 试 给 出 一 个 概 化 的 例子 。 这 个 例子 应 至 少 包含 一 个 超 类 和 三 个 子 类 ， 对 于 每 个 类 至 少 


给 出 一 


个 属性 和 一 个 操作 ， 指 出 鉴别 符 并 说 明子 类 之 间 的 语义 约束 。 


11. 如 果 为 复习 问题 10 开 发 的 图 中 不 包含 抽象 类 ， 请 扩展 这 张 图 ， 添 加 一 个 至 少 包含 一 个 
抽象 操作 的 抽象 类 。 还 应 指出 ， 一 个 类 的 哪些 特性 被 其 他 类 继承 。 

12. 使 用 (或 在 必要 时 扩展 ) 复习 问题 11 的 图 ， 给 出 多 态 的 一 个 例子 。 

13. 试 给 出 一 个 聚合 的 例子 。 这 个 例子 应 至 少 包 含 一 个 聚合 对 象 和 三 个 组 件 对 象 ， 并 说 明 
在 所 有 聚合 联系 的 每 个 端的 多 重 性 。 
问题 和 练习 


1. 


为 下 面 列 出 的 每 种 情况 绘制 类 图 ， 表 示 出 有 关 的 类 、 属 性 、 操 作 和 联系 (如 果 你 认为 有 


必要 做 出 额外 的 假设 ， 那么 说 明 对 每 种 情况 作出 的 假设 ): 


a. 


TS 


oO 


[= 本 


ec. 


一 个 公司 有 若干 员工 。 员 工 (Employee ) 的 属性 有 员工 工 号 (employeeID， 主 键 )、 姓 
名 (name)、 地 址 (address) 和 出 生日 期 (birthdate )。 这 个 公司 还 有 若干 项 目 (Project)。 
项 目的 属性 有 项 目 名 (projectName) 和 开始 日 期 (startDate )。 每 个 员工 可 以 被 指派 到 
一 个 或 多 个 项 目 中 ， 也 可 以 不 指派 到 任何 项 目 中 。 一 个 项 目 至 少 要 指派 一 个 员工 ， 也 可 
以 指派 任意 数目 的 员工 。 一 个 员工 的 工资 等 级 随 着 项 目 而 变化 ， 公 司 希 望 记 录 每 个 员工 
指派 到 特定 项 目 时 所 适用 的 工资 等 级 。 在 月 末 ， 公 司 给 每 个 在 这 个 月 参加 项 目 工作 的 员 
工 发 一 个 支票 。 支 票 的 数额 是 根据 员工 参加 项 目的 时 间 和 工资 等 级 给 出 的 。 


.一 个 大 学 在 课程 目录 中 设置 了 大 量 课程 (Course)。 课 程 的 属性 包括 课程 编号 


(courseNumber， 主 键 )、 课 程 名 (courseName) 和 单元 (units )。 每 门 课 程 可 以 有 一 门 
或 多 门 不 同 课程 作为 预备 课程 ， 也 可 以 没有 预备 课程 (prerequisites )。 类 似 地 ， 一 门 课 
程 也 可 以 是 若干 门 课 程 的 预备 课程 ， 也 可 以 不 是 任何 课程 的 预备 课程 。 只 有 在 课程 的 导 
师 (director) 做 出 申请 时 ， 大 学 才 可 以 为 这 门 课 程 加 入 或 撤销 一 门 预 备课 程 。 


.一 个 实验 宣 有 若干 化 学 家 ， 而 每 个 化 学 家 可 在 一 个 或 多 个 项 目 上 工作 。 化 学 家 在 进行 每 


个 项 目 可 以 使 用 若干 设备 。 化 学 家 (Chemist) 的 属性 包括 姓名 (name) 和 电话 号 码 
(phoneNo)。 项目 (Project) 的 属性 包括 项 目 名 (projectName) 和 开始 日 期 (startDate ) 。 
设备 (Equipment) 的 属性 包括 序号 (serialNo) 和 价格 (cost)。 组 织 希望 记录 指派 日 期 
(assignDate ) 和 总 时 数 (totalHours )， 指 派 日 期 是 指 把 一 个 给 定 的 设备 指派 给 从 事 某 个 
特定 项 目的 某 个 化 学 家 的 日 期 ， 总 时 数 是 指 化 学 家 使 用 该 设备 从 事 其 项 目的 总 时 数 。 组 
织 也 要 求 追 踪 化 学 家 使 用 每 一 种 设备 的 情况 。 需 要 计算 化 学 家 在 所 有 指派 的 项 目 中 使 用 
设备 的 平均 时 数 。 一 个 化 学 家 必须 被 指派 到 至 少 一 个 项 目 ， 并 至 少 为 他 分 配 一 个 设备 。 
一 个 给 定 的 设备 不 必 分 配给 化 学 家 ， 而 且 一 个 给 定 的 项 目 也 未 必 能 分 配给 某 个 化 学 家 或 
某 个 设备 。 


:一 个 学 院 的 课程 可 以 有 一 个 或 多 个 班级 ， 也 可 以 没有 班级 。 课 程 (Course) 的 属性 有 课 


程 标识 (courseID)、 课 程 名 (courseName) 和 单元 (units)。 班 (Section ) 的 属性 有 班 
号 (sectionNumber) 和 学 期 (semester)。 班 号 的 值 是 一 个 整数 (例如 “1” 或 “2”)， 
用 于 区 别 同一 门 课程 的 不 同班 ， 但 是 不 能 惟一 标识 一 个 班 。 操 作 findNumSections 用 于 查 
找 在 某 学 期 某 门 课程 所 安排 的 班 数 。 

一 个 医院 有 许多 注册 的 医生 。 医 生 (Physician ) 的 属性 有 医生 标识 (physicianID， 主 键 ) 
和 专长 (specialty ) 。 病 人 被 医生 收入 医院 治 病 。 病 人 (Patiant) 的 属性 有 病人 标识 
(patiantID， 主 键 ) 和 病人 姓名 (patiantName)。 任 何 住院 的 病人 必须 被 一 位 医生 收入 医 
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院 。 一 个 医生 可 以 收入 任何 数目 的 病人 。 一 旦 病人 住院 ， 必 须 由 至 少 一 个 医生 治疗 。 一 

个 医生 可 以 治疗 任何 数目 的 病人 ， 也 可 以 不 治疗 任何 病人 。 在 病人 被 医生 治疗 期 间 ， 医 

院 应 记录 治疗 的 详细 情况 (details )， 包 括 治疗 的 日 期 (date )、 次 数 (time) 和 结果 

(results ) 。 

2. 学 生 的 属性 有 学 生 名 (studentName )、 地 址 (address)、 电 话 (phone) 和 年 龄 (age )， 
学 生 可 以 参加 多 种 校园 活动 。 学 校 要 记录 学 生 参 加 活动 的 年 份 ， 同 时 在 每 学 年 结束 时 发 给 学 生 
一 份 参加 各 种 活动 的 活动 报告 。 试 为 上 述 情况 绘制 一 个 类 图 。 

3. 试 为 一 个 房地产 公司 设计 一 个 类 图 以 列 出 销售 的 房产 。 下 面 是 对 这 个 组 织 的 描述 : 

* 公司 在 许多 州 (states) 有 若干 销售 部 (sales offices) ; 地 点 (location) 是 销售 部 的 一 

个 属性 。 

“每 个 销售 部 有 一 名 或 多 名 员工 。 员 工 的 属性 包括 员工 标识 (employeeID )、 员 工 名 

(employeeName)。 一 个 员工 只 能 在 一 个 销售 部 工作 。 

* 在 每 个 销售 部 中 ， 有 一 名 员工 被 指定 为 经 理 。 一 个 员工 只 可 以 管理 他 所 在 的 销售 部 。 

“公司 所 销售 的 房产 (property) 列表 。 房 产 的 属性 有 房产 名 (propertyName) 和 地 点 

(location ) 。 

* 每 一 处 房产 必须 由 其 中 一 个 (只 有 一 个 ) 销售 部 负责 。 一 个 销售 部 可 以 负责 若干 个 房产 ， 

也 可 能 不 负责 任何 房产 。 

* 每 一 处 房产 可 以 有 一 个 或 多 个 拥有 者 (owners )。 拥 有 者 的 属性 包括 拥有 者 名 字 

(ownerName) 和 地 址 (address)。 一 个 拥有 者 可 以 拥有 一 个 或 多 个 单位 房产 。 对 于 拥有 

者 拥有 的 每 个 房产 ， 称 为 percentOwned 的 属性 指出 拥有 者 拥有 的 房产 的 百分比 。 

试 在 类 图 中 确定 的 两 个 关联 中 加 入 一 个 子 集约 束 。 

4. 试 为 你 熟悉 的 某 个 组 织 绘制 类 图 ， 例 如 男 童子 军 /女童 子 军 、 运 动 队 等 。 在 图 中 至 少 应 
为 四 个 关联 角色 指出 名 字 。 

5. 试 为 下 列 情况 绘制 类 图 (同时 说 明 为 了 开发 一 个 完整 的 图 而 做 出 的 假设 ): 

Stillwater 古 董 店 购买 和 销售 各 种 的 古董 ( 例如 家 具 、 珠 宝 、 资 器 和 衣物 )。 每 一 项 惟一 地 
用 项 目 号 标识 ， 并 且 用 描述 、 开 价 、 条 件 和 自由 评论 来 刻画 。Stillwater 古 董 店 有 许多 不 同 的 客 
户 ,这 些 客 户 在 古董 店 销售 或 购买 古董 。 某 些 客户 只 向 古董 店 销售 古董 ， 某 些 客户 只 购买 古董 ， 
还 有 些 客户 既 销 售 也 购买 。 每 个 客户 用 客户 编号 标识 ， 用 客户 名 和 客户 地 址 来 描述 。 当 十 董 店 
以 现货 形式 销售 给 客户 一 件 古董 时 ， 拥 有 者 要 求 记录 支付 的 佣金 、 实 际 销售 价格 、 销 售 税 ( 零 
税 表示 免税 销售 ) 和 销售 日 期 。 当 古董 店 购买 客户 的 货物 时 ， 拥 有 者 要 求 记录 购买 价值 、 购 买 
日 期 和 购买 条 件 。 

6. 试 为 下 列 情况 绘制 一 个 类 图 (同时 应 说 明 为 了 开发 一 个 完整 的 图 而 做 出 的 假设 ): 

HITopi 商 业 学 校 的 业务 遍及 欧州 的 10 个 地 点 。 学 校 在 1965 年 已 有 第 一 批 毕 业 生 9000 人 。 学 
校 记载 了 每 个 毕业 生 的 学 生 学 号 、 姓 名 、 出 生 国 、 现 在 的 国籍 、 现 在 的 姓名 、 现 在 的 地 址 和 学 
生 的 专业 名 称 (每 个 学 生 有 1 至 ?个 专业 )。 为 了 保持 与 毕业 生 的 密切 联系 , 学 校 设置 了 各 种 事件 。 
每 个 事件 有 标题 、 日 期 、 位 置 和 类 型 (例如 招待 会 、 餐 会 或 研讨 会 )。 学 校 要 记载 哪些 学 生 参 加 
了 哪些 事件 。 对 于 事件 中 参加 的 学 生 ， 应 记载 校方 人 员 从 事件 中 学 生 那 里 听 来 的 信息 。 学 校 还 
应 该 通过 邮件 、 电 子 邮件 、 电 话 和 电 传 等 与 学 生 保持 联系 。 伴 随 这 些 事件 ， 学 校 还 记载 了 来 自 
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(用 部 件 名 、 说 明和 计量 单位 描述 ) 组 合 而 成 ， 并 且 这 些 部 件 也 可 用 于 制造 一 个 或 多 个 产品 。 
另外 ， 假 设 部 件 可 以 用 来 制造 其 他 部 件 ， 这 样 ， 原 材料 也 可 视 为 部 件 。 在 这 两 种 情况 下 ， 我 们 
需要 记载 有 多 少 部 件 用 于 制造 其 个 产品 。 试 为 上 述 情况 画 一 个 类 图 ， 并 指出 图 中 所 标识 的 联系 
的 多 重 性 。 

8. 试 为 下 述 问 题 画 一 个 类 图 。 一 个 非 盘 利 性 组 织 依赖 于 若干 不 同类 型 人 来 成 功 完 成 操作 。 
这 个 组 织 对 这 些 人 的 下 列 属性 感 兴趣 : 社会 安全 号 (ssn)、 姓 名 (name)、 地 址 (address) 和 
电话 (phone)。 最 感 兴 趣 的 是 以 下 三 种 类 型 的 人 : 员工 (employees)、 志 愿 者 (volunteers ) 和 
捐赠 者 (donors ) 。 每 个 人 具有 这 些 属 性 以 外 ， 员 工 还 有 一 个 称 为 聘用 日 期 (dateHired) 的 属 
性 ， 志 愿 者 还 有 一 个 称 为 技能 (skill) 的 属性 ， 捐 赠 者 是 已 经 捐赠 了 一 件 或 多 件 物 品 (items) 
给 组 织 的 人 。 物 品 用 名 称 (name ) 说 明 ， 该 物品 可 能 没有 捐赠 者 ， 也 可 能 有 一 个 或 多 个 捐赠 
者 。 在 捐赠 物品 时 ， 组 织 将 记载 它 的 价值 (Price )， 以 便 在 年 末 时 能 确定 前 十 位 捐赠 者 。 

有 一 种 人 不 属于 员工 、 志 愿 者 、 捐 赠 者 ， 但 对 该 组 织 很 关心 ， 因 而 这 种 人 不 属于 上 述 三 种 类 
型 。 另 一 方面 ， 在 某 一 时 刻 ， 一 个 人 可 能 同时 属于 两 种 类 型 或 多 种 类 型 (例如 员工 和 捐赠 者 ) 。 
9. 银行 有 三 种 账户 : 支票 (checking)、 存 款 (savings)、 贷 款 (loan)。 下 面 是 每 种 账户 的 
属性 : 

CHECKING: Acct_No、PDate_Opened、Balance、Service_Charge 

SAVINGS: Acct_No、 Date_Opened、 Balance、 Interest_Rate 

LOAN: Acct_No、 Date Opened, Balance、 Interest_Rate、 Payment 

假设 每 个 银行 账户 必须 是 这 三 种 账户 中 的 一 种 。 在 每 个 月 末 银 行 计算 每 个 账户 的 余额 ， 并 
发 邮件 给 持 有 该 账户 的 顾客 。 余 额 的 计算 取决 于 这 个 账户 的 类 型 。 例 如 ， 支 票 账户 余额 可 能 影 
响 服务 收费 ， 反 之 存款 账户 余额 可 能 包含 利息 金额 。 试 绘制 一 个 类 图 表示 上 述 情况 。 图 中 应 包 
含 一 个 抽象 类 ， 以 及 计算 余额 的 一 个 抽象 操作 。 

10. 再 一 次 考察 关于 医院 联系 的 类 图 (参见 图 14-9b)。 试 添加 符号 来 表示 下 列 业务 规则 : 
只 有 在 病人 被 指派 了 他 的 主治 医生 时 ， 这 个 病人 才 有 可 能 分 配 到 一 个 床位 。 

11. 现 委托 一 个 组 织 开发 一 个 保存 某 个 州 所 注册 的 所 有 车 辆 的 注册 和 牌照 信息 的 系统 。 对 
于 注册 的 车 辆 ， 系 统 必须 存储 车 主 的 姓名 、 地 址 、 电 话 号 码 ， 以 及 注册 的 开始 和 结束 日 期 、 牌 
照 信 息 (发 牌 者 、 年 份 、 型 号 和 编号 )、 操 纵 杆 ( 年份 、 型 号 和 编号 ) 和 注册 费 。 此 外 ， 还 应 
保存 有 关 车 辆 本 身 的 信息 : 编号 、 年 份 、 制 造 者 、 型 号 、 车 身 样式 、 重 量 、 乘 客 数 、 柴 油 机 动 
力 〈 是 / 否 )、 颜 色 、 价 值 和 行驶 里 程 。 如 果 车 辆 是 拖车 ， 那 么 参数 柴油 机 动力 和 乘客 数 就 无 关 
紧要 了。 对 于 旅游 车 ， 必 须知 道 车 身 的 编号 和 长 度 。 系 统 必须 保存 客车 的 行李 容量 、 卡 车 的 最 
大 载 货 容量 和 最 大 拖带 能 力 、 摩 托 车 的 马力 等 信息 。 在 车 主 注册 两 个 月 后 ， 系 统 将 发 出 注册 通 
知 。 在 车 主 重新 注册 时 ， 系 统 将 更 新 有 关 车 辆 的 注册 信息 。 

a. 绘制 类 图 来 开发 一 个 面向 对 象 模型 来 表示 所 有 的 对 象 类 、 属 性 、 操 作 、 联 系 和 多 重 性 。 
对 于 每 个 操作 ， 列 出 其 参数 。 

b. 每 一 辆 车 有 驱动 装置 ， 驱 动 装置 包括 发 动机 和 变速 器 (忽视 拖车 未 必 有 发 动机 和 变速 
器 这 个 事实 )。 假 设 对 于 每 一 辆 车 ， 系 统 必 须 保存 下 列 信息 : 发 动机 汽缸 的 尺寸 和 数 
量 ， 变 速 器 的 型 号 和 重量 。 试 在 类 图 中 加 一 些 类 、 属 性 和 联系 来 表示 这 些 信息 。 

c. 试 给 出 一 个 在 子 类 或 子 类 之 间 重 载 的 操作 的 例子 (也 可 以 创建 一 个 例子 )。 把 这 个 操 
作 加 到 类 图 中 合适 的 地 方 ， 并 讨论 重 载 的 理由 。 

应 用 练习 
1. 访问 一 位 朋友 或 家 庭 成 员 ， 找 出 一 些 有 超 类 / 子 类 联系 的 例子 。 还 必须 解释 一 些 术 语 的 
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意义 并 提供 一 些 常见 的 例子 ， 例 如 : 

PROPERTY: RESIDENTIAL，COMMERCIAL 

BONUS: CORPORATE, .MUNICIPAL 

利用 这 些 信 息 来 构造 一 个 类 图 ， 并 把 类 图 反馈 给 朋友 。 不 断 修改 这 张 类 图 ， 直 到 你 和 你 的 
朋友 或 家 庭 成 员 觉 得 合适 为 止 。 

2. 参观 两 个 本 地 的 小 企业 ， 一 个 属于 服务 业 ， 另 一 个 属于 制造 业 。 访 问 这 些 组 织 中 的 员工 ， 
以 获得 超 类 / 子 类 联系 和 操作 性 业务 规则 〈 例 如 “只 有 顾客 具有 有 效 的 销售 凭证 时 才能 退货 ”) 
的 例子 。 在 什么 环境 下 才能 容易 地 发 现 这 些 构造 的 例子 ? 为 什么 ? 

3. 咨询 本 地 企业 的 数据 库 管理 员 或 者 数据 库 和 系统 分 析 人 员 ， 为 企业 的 主 数据 库 设 计 一 个 
EER (或 ER) 图 。 把 这 张 图 转换 成 一 张 类 图 。 

4. 访问 本 地 公司 中 使 用 过 面向 对 象 程序 设计 语言 或 系统 开发 工具 的 系统 分 析 员 。 就 已 经 绘 
制 出 的 有 关 数 据 库 和 应 用 的 分 析 图 和 设计 图 ， 向 他 请 教 。 试 将 这 些 图 与 本 章 的 图 进行 比较 。 你 
认为 有 什么 差别 ?使 用 了 哪些 附加 的 特性 与 符号 ”其 意图 是 什么 ? 
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项 目 案例 : 山 景 社区 医院 


项 目 描述 

这 个 项 目 描述 类 似 于 第 4 章 中 的 项 目 描述 。 在 你 完成 这 个 项 目 后 ， 你 可 以 对 第 3、4 章 开发 
的 数据 模型 进行 比较 。 

山 景 社区 医院 是 一 个 很 大 的 服务 性 组 织 ， 由 于 许多 人 的 工作 才能 保证 其 正常 运转 。 医 院 主 
要 依靠 四 种 人 : 员工 (employees)、 医 生 (physicians)、 病 人 (patiants ) 和 志愿 者 (volunteers ) 。 
当然 ， 这 些 人 都 有 公共 的 属性 : 个 人 标识 (personID )、 姓 名 (name)、 地 址 (address )、 邮 政 
编码 〈city-state-zip)、 生 日 (dateOfBirth) 和 电话 (phone ) 。 

其 中 每 一 种 人 都 至 少 有 一 个 惟一 的 属性 。 员 工 有 聘用 日 期 (dateHired )， 志 愿 者 有 技能 
(sKi) ， 医 生 有 特长 (speciality ) 和 呼 机 号 (pagerNumber)， 病 人 有 就 诊 日 期 (ofContact， 指 
第 一 次 上 医院 的 日 期 ) 和 calc-age。 每 一 种 人 都 还 有 惟一 的 方法 。 员 工 有 calc-benefits ， 志 愿 者 
有 assign-to-Cneter， 医 生 有 treats， 病 人 有 calc 和 assignToLocation。 也 是 病人 的 员工 或 医生 还 有 
一 个 属性 SpecialService 。 

在 医院 里 还 有 其 他 一 些 人 ， 这 些 人 不 属于 上 述 四 种 人 (这些 人 实际 上 很 少 )。 另 一 方面 ， 
某 一 个 人 也 可 以 在 某 一 时 刻 属于 其 中 的 两 种 (或 多 种 ) 人 (例如 病人 和 志愿 者 )。 

每 个 病人 有 一 个 〈 且 只 有 一 个 ) 主治 医生 。 一 个 医生 在 某 时 刻 可 能 不 作为 任何 病人 的 主治 
医生 ， 也 可 能 是 一 个 或 多 个 病人 的 主治 医生 。 病 人 分 成 两 类 : 住院 病人 (resident) 和 出 院 病 
人 (outpatient ) 。 每 个 住院 病人 有 属性 dateOfAdmission 和 一 个 方法 assignToBed， 这 个 方法 重 载 
了 所 有 病人 的 方法 assignToLocation。 每 个 出 院 病人 可 安排 零 次 或 多 次 复诊 。 实 体 visit 有 两 个 属 
性 : date 和 comments。 如 果 不 存在 一 个 出 院 病人 的 实体 ， 那 么 回复 的 实例 也 不 可 能 存在 。 

员工 分 成 三 类 : 护士 (nurse)、 职 工 (staff) 和 技术 人 员 (technician)。 只 有 护士 才 有 表 
示 其 熟练 程度 (RN、LPN 等 ) 的 属性 certificate。 只 有 职工 才 有 属性 jobClass， 而 只 有 技术 人 员 
才 有 skill 属 性 。 每 个 护士 被 分 配 到 一 个 ( 且 只 有 一 个 ) 治疗 中 心 (care center)。 例 如 ， 
Maternity (产科 )、Emergency (急诊 ) 和 Cardiology ( 即 病房 ) 等 治疗 中 心 。 治 疗 中 心 的 属性 
有 name (标识 符 ) 和 location。 一 个 治疗 中 心 可 以 有 一 个 或 多 个 护士 。 还 有 ， 对 于 每 个 治疗 中 
心 ， 其 中 一 个 护士 被 指定 为 主管 护士 (nurse_in_charge) ; 但 是 只 有 获得 RN 证 书 的 护士 才能 指 
定 为 主管 护士 。 治 疗 中 心 在 某 幢 大 楼 中 ， 因 而 大 楼 可 用 大 楼 编号 (buildingNumber)、 名 称 
(buildingName) 和 代码 (buildingCode ) 描述 。 

每 一 个 技术 人 员 被 分 配 到 一 个 或 多 个 实验 室 。 实 验 室 的 属性 有 name (标识 符 ) 和 location 。 
一 个 实验 室 至 少 有 一 个 技术 人 员 ， 也 可 以 有 任意 多 个 技术 人 员 。 一 个 实验 室 只 能 位 于 一 幢 大 楼 
内 ， 但 读 大 楼 内 可 以 有 许多 实验 室 。 实 验 室 里 有 许多 设备 和 在 该 实验 室 工作 的 员工 ， 因 而 实验 
室 还 有 一 个 方法 numberOfEmployees。 

可 以 不 给 治疗 中 心 分 配 病床 ， 但 可 以 给 治疗 中 心 分 配 一 个 或 多 个 (直至 任意 数目 ) 病床 。 
病床 只 有 一 个 属性 bedID (标识 符 ) 和 一 个 方法 utilization。bedID 是 一 个 复合 属性 ， 由 
bedNumber 和 roomNumber 组 成 。 每 个 住院 病人 必须 有 一 个 病床 。 一 个 病床 在 某 个 时 刻 可 能 分 
配 (或 不 分 配 ) 一 个 住院 病人 。 : 

项 目 问 题 

1) 在 像 山 景 社区 医院 这 样 的 环境 中 建 模 超 类 / 子 类 联系 的 功能 是 否 很 重要 ?为 什么 ? 

2) 在 这 个 项 目 数据 需求 的 描述 中 ， 出 现 过 链接 对 象 吗 ?如 果 出 现 过 ， 列 举 出 这 些 链接 对 
象 。 
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3) 在 这 个 医院 的 描述 中 ， 是 否 存在 抽象 对 象 类 ?为 什么 ? 
项 目 练习 
1) 试 画 一 个 类 图 ， 遵 循 本 章 的 表示 法 准确 地 表示 这 个 需求 集 。 
2) 试 为 项 目 练习 1 的 类 图 中 的 下 面 每 一 种 类 型 对 象 进行 定义 。 你 可 以 咨询 医院 或 医疗 机 构 
中 的 人 员 ; 也 可 以 基于 你 的 知识 和 经 验 作出 合理 的 假设 。 
a, 类 b. 属性 
c. 联系 d. 方 法 
3) “只 有 获得 RN 证 书 的 护士 才能 指定 为 主管 护士 "， 这 是 一 条 业务 规则 。 这 条 规则 与 第 4 
章 项 目 练习 有 所 不 同 , 现在 你 怎样 建 模 这 条 规则 ? 什么 是 约束 对 象 ? 它 是 一 个 实体 、 一 个 属性 、 
一 个 联系 还 是 某 个 其 他 对 象 ? 
4) 比较 本 章 开发 的 类 图 与 第 4 章 开发 的 EER 图 和 第 3 章 开发 的 ER 图 。 这 几 张 图 之 间 区 别 是 
什么 ? 为 什么 有 这 些 区 别 ? 
5) 在 本 章 的 项 目 描述 中 ， 试 找 出 育 合 和 复合 的 例子 ， 并 说 明 你 的 理由 。 





第 15 章 面向 对 象 数据 库 开 发 


15.1 学 习 目 标 


学 完 本 章 9 后 ,读者 应 该 具备 以 下 能 力 : 

* 简要 地 定义 下 列 每 一 个 关键 术语 : 诛 子 文字 、 集 合 文字 、 集 、 包 、 列 表 、 数 组 、 词 典 、 
结构 化 文字 和 外 延 (extent ) 。 

。 使 用 对 象 定义 语言 (ODL ) 创建 面向 逻辑 对 象 的 数据 库 模 式 。 

“通过 映射 类 (抽象 的 和 具体 的 )、 属 性 、 操 作 (抽象 的 和 具体 的 )、 关 联 联 系 (一 对 一 、 
一 对 多 、 多 对 多 ) 和 概 化 联系 ， 把 概念 UML 类 图 转化 为 逻辑 ODL 模 式 。 

。 为 属性 、 操 作 变 量 和 操作 返回 值 确定 类 型 规格 说 明 。 

。 创 建 对 象 并 指定 对 象 的 属性 值 。 

。 理 解 在 实现 面向 对 象 数据 库 时 设计 的 步骤。 

"理解 对 象 查询 语言 (OQL) 的 句法 和 语义 。 

* 使 用 OQL 命 令 编写 各 种 类 型 的 查询 。 

* 理解 应 用 面向 对 象 数据 库 的 应 用 的 类 型 。 


15.2 引言 


在 第 14 章 中 已 介绍 了 面向 对 象 数 据 建 模 技术 。 我 们 已 学 过 怎样 使 用 UML 类 图 来 概念 性 地 
进行 数据 库 建 模 。 本 章 将 曾 述 怎样 把 概念 面向 对 象 模 型 转换 成 能 使 用 对 象 数 据 库 管 理 系 统 
(ODBMS ) 直接 实现 的 逻辑 模式 。 

正如 后 面 将 提 到 的 ， 虽然 关系 数据 库 在 传统 业务 应 用 方面 非常 有 效 ， 但 在 存储 和 操纵 复杂 
数据 和 联系 时 有 很 严重 的 局 限 性 (在 程序 设计 需求 和 DBMS 性 能 方面 )。 本 章 将 说 明 在 面向 对 
象 数据 库 环境 中 怎样 实现 应 用 。 

本 章 采 用 对 象 数据 库 管 理 组 织 (ODMG ) 建议 的 对 象 模型 (Object Model) 来 定义 和 查询 
面向 对 象 数据 库 (OODB )。 在 开发 逻辑 模式 时 ， 会 专门 使 用 对 象 定义 语义 (OPDL ) ， 这 是 在 
ODMG 3.0 标 准 中 为 OODB 规 定 的 一 种 数据 定义 语言 (Cattle 等 ，2000)。ODMG 是 在 1991 年 由 
OODB 软 件 商 为 了 创建 标准 而 组 成 的 一 个 组 织 ， 以 便 使 DODB 更 加 可 行 。 就 像 SQL 数 据 定义 语 
言 DDL ) 模式 能 在 兼容 SQL 的 关系 DBMS 中 实现 (参见 第 7 章 ) 一 样 ， 用 ODL 创 建 的 逻辑 模 
式 能 在 兼容 ODMG 的 ODBMS 中 实现 。 

我 们 将 使 用 类 似 于 第 14 章 中 的 例子 来 说 明 怎样 把 概念 UML 类 图 变换 为 逻辑 ODL 模 式 。 我 
们 将 学 到 怎样 把 类 (抽象 的 和 具体 的 )、 属 性 、 操 作 (抽象 的 和 具体 的 )、 关 联 联系 (一 元 和 二 
元 ) 和 概 化 联系 从 UML 类 图 上 映射 到 相应 的 ODL 结 构 。 

在 第 7 章 中 ，SQL 中 除了 DDL 成 分 外 ， 还 包括 数据 操纵 语言 (DML) 成 分 ，DML 人 允许 用 户 
查询 或 操纵 关系 数据 库 中 的 数据 。 有 一 种 与 其 类 似 的 语言 称 为 对 象 查询 语言 (OQL)，ODMG 
3.0 标 准 指定 用 OQL 来 查询 对 象 数据 库 (Cattell 等 ，2000)。 本 章 将 兽 述 怎样 使 用 OQL 来 编写 各 
种 类 型 的 查询 。ODMG 组 织 已 规定 了 C++、Smalltalk 和 Java 版 本 的 ODL 和 OQL。 在 本 章 的 例子 


日 ”本 章 的 最 初版 本 由 Wisconsin-Milwaukee 大 学 的 Atish PSinha 教 授 编写 。 
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中 ， 我 们 使 用 比较 常见 的 版 本 。 

在 第 14 章 已 给 出 松 谷 家 具 公 司 公司 的 一 个 概念 面向 对 象 模型 。 在 本 章 中 ， 将 把 这 个 概念 模 
型 转换 成 逻辑 ODL 模 式 。 最 后 ， 将 讨论 适用 ODBMS 的 应 用 类 型 并 简单 描述 使 用 已 有 的 
ODBMS 产 品 开发 的 某 些 应 用 。 


15.3 对象 定义 语言 


在 第 7 章 已 学 习 过 怎样 使 用 SQL 数据 定义 语言 (DDL) 来 为 关系 数据 库 指 定 逻 辑 模式 。 类 
似 地 ， 可 以 使 用 对 象 定义 语言 (ODL) 来 为 面向 对 象 数据 库 指定 逻辑 模式 。ODL 是 一 个 用 于 定 
义 OODB 模 式 的 与 程序 设计 语言 无 关 的 说 明 性 语言 。 就 像 SQL DDL 模 式 可 移植 到 兼容 SQL 的 关 
系 DBMS 上 一 样 ，ODL 模 式 也 可 以 移植 到 任何 兼容 ODMG 的 ODBMS 上。 

15.3.1 定义 类 

图 15-1 显 示 了 大 学 数据 库 的 一 个 概念 UML 类 图 ( 可 参阅 第 14 章 对 这 个 类 图 的 解释 )， 这 是 
一 个 所 有 读者 都 熟悉 的 例子 。 现 在 ， 我 们 重点 关注 一 下 Student 和 Course 类 ， 以 及 它们 的 属性 。 
在 ODL 中 ， 用 关键 字 class 指 定 类 ， 用 关键 字 attribute 指 定 属性 。Student 和 Course 类 用 如 下 形式 
定义 : 

class Student { 

attribute string name: 
attribute Date dateOfBirth; 
attribute string address; 
attribute string phone; 
/7 加 入 联系 和 操作 … 
}); 
class Course { 
attribute string crse code; 
attribute string crse title; 
attribute short credit hrs; 

// 加 入 联系 和 操作 … 

}; 

我 们 用 黑体 强调 了 ODL 的 关键 字 。 此 外 ， 还 添加 了 注释 (前面 用 符号 “//” 标 出 ) 指出 在 
稍 后 阶段 还 需 把 联系 和 操作 (参见 图 15-1) 加 到 类 中 。 在 attribute 关 键 字 的 后 面 指定 属性 的 类 
型 ， 后 面 跟 属 性 名 。 
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register_for(crse, sec, term) Has prereqs 人 











4 ls prere9 for 


图 15-1 大 学 数据 库 的 UML 类 图 
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15.3.2 定义 属性 

属性 的 值 可 以 是 一 个 文字 (literal)， 也 可 以 是 一 个 对 象 标识 符 。 在 第 14 章 已 讨论 过 ， 每 个 
对 象 都 有 一 个 惟一 的 标识 符 。 由 于 对 象 在 它 的 生存 期 内 保留 着 标识 符 ， 所 以 即使 对 象 的 状态 改 
变 了 ， 但 对 象 仍 保持 同样 的 标识 符 。 相 反 ， 文 字 没 有 标识 符 ， 因 此 不 可 能 像 对 象 那样 被 单独 引 
用 。 文 字 是 贬 入 在 对 象 里 的 。 可 以 将 文字 值 看 作 常 量 。 例 如 ， 字 符 串 Mary Jones、 字 符 C 和 整 
数 20 等 都 是 文字 值 。 

对 象 模型 (Object Model) 支持 不 同 的 文字 类 型 ， 包 括 原子 文字 、 集 合 文字 和 结构 化 文字 。 
原子 文字 (atomic literal ) 类 型 的 例子 有 string、char (字符 )、boolean ( 真 或 假 )、float (实数 )、 
short ( 短 整数 ) 和 long (长 整数 )。 

集合 文字 (coliection literal) 是 元 素 的 集合 ， 这 些 元 素 本 身 可 以 是 任意 的 文字 或 对 象 类 型 。 
ODMG 对 象 模型 支持 的 集合 文字 类 型 有 set ( 集 )、bag ( 包 )、list (列表 )、array (数组 ) 和 
dictiondry (词典 ) 五 种 。 集 (set) 是 同样 类 型 的 不 允许 有 重复 元 素 的 无 序 集合 。 包 (bag) 是 
间 样 类 型 的 允许 有 重复 元 素 的 无 序 集合 。 与 集合 和 包 不 一 样 ， 列 表 (list) 是 同类 型 元 素 的 有 
序 集合 。 数 组 (array ) 是 能 用 位 置 定位 的 元 素 的 有 序 集合 ， 并 且 其 大 小 可 以 动态 变化 。 词 典 
(dictionary) 是 由 键 - 值 对 组 成 的 不 带 重 复元 素 的 无 序 序列 。 

也 称 为 结构 的 结构 化 文字 (structured literal) 由 固定 数目 的 已 命名 元 素 组 成 ， 每 一 个 元 
素 可 以 是 文字 或 对 象 类 型 。 对 象 模 型 支持 下 列 预定 义 的 结构 : Date (日 期 )、Interval (时 间 间 
隔 )、Time (时 间 ) 和 Timestamp (时 间 发 )。 对 象 模型 还 支持 用 户 定 义 的 结构 ， 其 例子 将 在 后 
面 给 出 。 

现在 再 查看 大 学 数据 库 的 ODL 模 式 。Student 的 属性 name、address、phone 以 及 课程 的 属性 
crse_code 和 crse_title 都 是 字符 串 类 型 。 字 符 串 属性 能 存储 一 串 用 双 引 号 界定 的 字母 数字 字符 。 
Course 的 属性 credit_hrs 是 短 整数 ， 这 是 因为 它 的 值 总 是 小 于 2 的 一 个 整数 。 除 了 这 些 原子 文字 
类 型 以 外 ， 模 式 还 为 Student 的 属性 dateOfBirth 指 定 结构 化 文字 类 型 Date。 

15.3.3 定义 用 户 结构 

除了 ODL 提 供 的 标准 数据 类 型 以 外 ， 用 户 还 可 以 使 用 关键 字 struct 定 义 结构 。 例 如 ， 可 以 
定义 称 为 Address (地 址 ) 的 结构 ,这 个 结构 有 四 个 部 分 一 一 street_adress (街道 )、city (城市 )、 
state ( 州 ) 和 zip (邮编 )， 这 四 个 部 分 都 是 字符 串 属 性 。 


Struct Address{ 





string street address; 
string city; 
string state; 
string zip; 
}; 
类 似 地 ， 也 可 以 定义 phone (电话 号 码 ) 为 由 area_code (区 号 ) 和 personal_number (个 人 
号 码 ) 组 成 的 结构 。 注 意 ，personal_number 被 指定 成 long 是 因为 它 要 超过 2'。 
struct Phonef{ 
short area code; 
long personal number; 
}; 
有 些 结构 能 够 用 来 作为 其 他 结构 的 元 素 。 例 如 ， 如 果 学 生 有 多 个 电话 号 码 ， 那 么 phone 属 
性 可 定义 为 下 列 形式 : 


attribute set <phone> phones; 
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15.3.4 定义 操作 
我 们 也 能 够 为 这 两 个 类 定义 操作 。 在 ODL 中 ， 可 以 在 操作 名 称 后 使 用 括号 来 指定 操作 。 
Student 的 ODL 定 义 可 用 下 列 形式 表示 : | 
class Student { 
attribute string name; 
attribute Date dateOfBirth,; 
// 用 户 定义 的 结构 化 属性 
attribute Address address; 
attribute Phone phone; 
// 加 入 联系 
/7 操作 
Short age (); 
float gpa (); 
boolean register for (string crse. short sec, string term); 


}; 

我 们 已 经 定义 了 图 15-1 中 所 示 的 三 个 操作 : age、gpa 和 register_for。 前 两 个 操作 是 查询 操 
作 。register_for 操 作 是 一 个 更 新 操作 ， 注 册 一 个 学 生 在 给 定 学 期 (term) 选中 某 门 课程 (crse) 
的 某 个 班 (sec)。 括 号 内 的 每 一 变量 的 前 面 都 注 明 了 它 的 类 型 9 。 还 必须 指定 每 个 操作 的 返回 
类 型 。 例 如 ，age 和 gpa 的 返回 类 型 分 别 是 short ( 短 整 型 ) 和 float (实数 )。register_for 操 作 的 返 
回 类 型 是 boolean 〈 真 或 假 )， 用 来 说 明 注册 是 否 成 功 完成 。 如 果 一 个 操作 不 返回 任何 值 ， 则 返 
同类 型 可 以 声明 成 void。 

每 一 个 对 象 类 型 也 可 以 有 预定 义 的 操作 。 例 如 ， 一 个 集 对 象 有 一 个 预定 义 的 操作 
“is_subset_of”， 一 个 数据 对 象 (属性 ) 有 一 个 预定 义 的 布尔 操作 “days_in_year”。 Cattell 等 
(2000) 的 著作 详细 介绍 了 预定 义 对 象 操作 。 

15.3.5 为 属性 定义 范围 

如 果 已 经 知道 一 个 属性 的 所 有 可 能 取 值 ， 那 么 可 以 用 ODL 枚 举 这 些 值 。 例 如 ， 如 果 已 知 一 
门 课程 的 最 大 班 号 为 8， 那 么 在 CourseOffering 类 中 的 属性 名 前 加 关键 字 enum， 然 后 在 属性 名 后 
洪 上 这 些 可 能 的 值 即 实现 了 枚 举 。 

class CourseOffering { 

attribute string term; 
attribute enum section{]1, 2, 3, 4, 5. 6, 7, 8}; 


/ /操作 


short enrollment (); 

}; 
15.3.6 定义 联系 

最 后 ， 把 图 15-1 中 显示 的 联系 加 到 ODL 模 式 中 。ODMG 对 象 模型 只 支持 一 元 和 二 元 联系 。 
在 图 15-1 中 有 两 个 二 元 联系 和 一 个 一 元 联系 。 在 第 14 章 中 已 讨论 过 ， 每 个 联系 都 是 双向 联系 。 
例如 ， 在 Student 和 CourseOffering 之 间 命名 联系 时 ， 从 前 者 到 后 者 的 联系 命名 为 Takes， 从 后 者 
到 前 者 的 联系 可 命名 为 Taken_by。 可 以 使 用 ODL 关 键 字 relationship 来 指定 这 个 联系 。 

class Student { 


attribute string name; 
attribute Date dateOfBirth; 


昌 ” 如 果 遵循 严格 的 OCL 诸 法 ， 参 数 类 型 的 前 面 必须 有 关键 字 in、out 或 inout， 它们 分 别 将 参数 说 明 为 输入 、 答 
出 或 给 入/ 输 出。 为 了 简单 起 见 ， 我 们 在 此 省 去 这 些 说 明 。 
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attribute Address address:; 

attribute Phone phone; 
// 在 Student 利 CourseOffering 之 间 的 联系 

relationship set <CourseOffering> takes inverse CourseOffering::taken by; 
/ /操作 

Short agel():; 

float gpa()}; 

boolean register for (string crse, short sec, string term); 


}; 

在 Student 类 中 ， 用 关键 字 relationship 定 义 “takes” 联 系 。 联 系 名 称 的 前 面 是 联系 的 目标 
CourseOffering。 由 于 一 个 学 生 可 以 选择 多 种 课程 设置 ， 因 此 使 用 关键 字 “set” 来 说 明 Student 
对 象 与 CourseOffering 对 象 集 (并 且 这 个 集 是 无 序 的 ) 有 联系 。 这 个 联系 规范 表示 了 从 Student 
到 CourseOffering 的 一 条 遍历 路 径 。 

ODMG 对 象 模 型 要 求 将 联系 指定 成 双向 的 。 在 ODL 中 ， 用 关键 字 inverse 来 指定 相反 方向 上 
的 联系 。 "takes” 的 逆 是 从 CourseOffering 到 Student 的 “taken_by”。 在 Student 的 类 定义 中 ,已 
经 命名 了 这 条 遍历 路 径 (taken_by)， 在 这 条 路 径 名 称 的 前 面 是 这 条 路 径 起 源 类 的 名 字 
(CourseOffering) 和 双 冒 号 (:: )。 在 下 面 显 示 的 CourseOffering 的 类 定义 中 ， 指 定 为 
taken_by” 的 联系 上 有 来 自 Student 的 逆 联 系 “takes”。 由 于 一 门 课 程 可 以 由 许多 学 生 选 定 ， 因 
此 联系 把 一 个 Student 对 象 集 链接 到 一 个 给 定 的 CourseOffering 对 象 。 对 于 这 种 多 对 多 联系 ， 必 
须 在 两 边 都 指定 对 象 的 集合 ( 集 、 列 表 、 包 或 数组 )。 

class CourseOffering { 

attribute string term; 

attribute enum section{1, 2, 3, 4, 5. 6. 7. 8}; 
// 作 Course0Offering 和 Student 之 间 的 多 对 多 联系 

relationship set <Student> taken by inverse Student::takes; 
// 在 Courseoffering 和 Course 之 间 的 一 对 多 联系 

relationship Course belongs to inverse Course::offers; 
/ /操作 

Short enrollment {); 

}; 

ODBMS 能 自动 强制 执行 在 ODL 模 式 中 指定 的 联系 的 参照 完整 性 规则 (Bertino 和 Martino， 
1993; Cattell 等 ，2000)。 例 如 ， 如 果 你 要 删除 一 个 Student 对 象 ， 那么 ODBMS 将 自动 解除 与 所 
有 CourseOffering 对 象 的 链接 , 也 解除 从 所 有 CourseOffering 对 象 返回 到 这 个 Student 对 象 的 链接 。 
如 时 你 把 一 个 Student 对 象 与 一 个 CourseOffering 对 象 集 链 接 起 来 ， 那 么 ODBMS 将 自动 创建 逆 链 
接 。 也 就 是 说 ， 创 建 从 每 一 个 CourseOffering 对 象 返 回 到 这 个 Student 对 象 的 链接 。 

在 CourseOffering 类 中 ,还 指定 了 另 一 个 联系 “belongs_to”,， 其 逆 是 来 自 Course 的 “offers”。 
由 于 一 个 课程 设置 只 能 属于 一 门 课程 ， 因 此 belongs_to 遍 历 路 径 的 目的 地 是 Course， 这 也 音 味 
着 CourseOffering 对 象 只 能 链接 到 一 个 Course 对 象 。 在 关联 联系 的 “一 “ 边 指定 时 ， 可 以 简单 
地 指定 目的 地 对 象 类 型 ， 而 不 是 对 象 类 型 的 集合 〈 例 如 集 )。 

下 面 说 明 怎 样 指定 Course 的 联系 和 操作 。 前 面 已 经 说 过 Course 中 的 联系 offers 的 逆 是 
belongs_to。 由 于 课程 设置 在 课程 中 是 有 序 的 (根据 某 个 学 期 的 班 号 )， 因 此 不 用 set， 而 是 用 
list 来 指定 集合 中 的 顺序 。 图 15-1 中 显示 的 一 元 联系 的 两 个 方向 上 ， has_prereqs 和 is_prereqs_for 
的 起 点 和 终点 都 在 Course 类 上 ，Course 的 定义 如 下 : 

class Course 

attribute bring crse code; 
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attribute string crse title; 

attribute short credit hrs; 
/ /预备 课程 的 元 联系 

relationship set <Course> has prereqs inverse Course::is prereq for; 

relationship set <Course> is prereq for inverse Course::has preregs; 
//CoursefllCourseOffering 之 间 的 “元 联系 

relationship list <CourseOffering> offers inverse CourseOffering::belongs to; 
// 操 作 

Short enrollment (); 


}; 


大 学 数据 库 完 整 的 模式 显示 在 图 15-2 中 。 注 意 ， 其 中 还 引入 了 ODL 关 键 字 extent 来 指定 类 
的 外 延 。 类 的 外 延 (extent) 是 数据 库 中 类 的 所 有 实例 的 集合 (Cattell 等 ，2000)。 例 如 ， 称 为 
Student 的 外 延 就 是 数据 库 中 所 有 的 Student 实 例 。 















class Student { 
( extent students) 

attribute string name; 

attribute Date dateOfBirth:; 

attribute Address address; 

attribute Phone phone; 

relationship set (CourseOffering) takes inverse CourseOffering::taken_by; 

Short agel ); 

float gpal ); 

boolean register_for(string crse, short sec, string term); 





} 


class CourseOffering { 

( _ extent courseofferings) 
attribute string term; 
attribute enum section {1, 2, 3, 4, 5, 6, 7, 8}): 
relationship set (Student) taken_by inverse Student::takes. 
relationship Course belongs_to inverse Course::offers， 
short enrollment( ); 









} 
class Course { 
( extent courses) 

attribute string crse_code; 

attribute string crse title; 

attribute short credit_hrs; 

relationship set (Course) has_prereqs inverse Course::is _prereq_for; 
relationship set (Course) is_prereq_for inverse Course::has _prereqs; 
relationship iist (CourseOffering) offers inverse CourseOffering::belongs to; 
short enrollment( ); 















图 15-2 大 学 数据 库 的 ODL 模 式 


15.3.7 定义 以 对 象 标识 符 作 为 值 的 属性 

迄今 看 到 的 所 有 例子 中 ,属性 值 都 是 文字 。 前 面 已 提 过 ,属性 值 也 可 以 是 一 个 对 象 标识 符 。 
例如 ，Course 中 有 一 个 称 为 “dept” 的 属性 ， 该 属性 表示 某 个 系 设置 了 这 门 课程 。 这 个 属性 不 
存储 系 名 ， 只 存储 Department 对 象 的 标识 符 。 因 此 ， 必 须 作 如 下 改变 : 


class Course { 
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/7 属性 daept 的 值 是 -个 对 象 标识 外 
attribute Department dept; 

/7 其 他 属性 、 操 作 和 联系 … 

} 

class Department { 
attribute short dept number; 
attribute string dept name; 
attribute string office address; 


}; 

dept 属 性 的 类 型 是 Department ， 表 示 属 性 值 是 Department 的 实例 的 对 象 标识 符 。 这 类 似 于 
从 Course 到 Department 的 一 个 单 向 联系 。 但 ODBMS 并 不 会 自动 维护 这 种 单 向 联系 的 参照 完整 
性 。 如 果 用 户 查 询 中 大 多 数 引用 是 从 Course 到 Department ( 例如， 查找 设置 给 定 课程 的 系 的 名 
称 ) ， 而 不 是 从 Department 到 Course， 并 且 没 有 设置 参照 完整 性 ， 那 么 使 用 属性 参照 在 一 个 方 
向 上 的 这 种 联系 的 表示 提供 了 一 种 更 有 效 的 候选 方案 。 
15.3.8 定义 多 对 多 联系 、 键 和 多 值 属性 

图 15-3a 显 示 了 Employee 和 Project 之 间 的 多 对 多 联系 。 为 了 完成 一 次 分 配 ， 必 须 有 一 个 
Employee 对 象 ， 以 及 一 个 Project 对 象 。 这 里 把 这 个 Assignment 建 模 成 带 有 自己 特性 的 关联 类 。 
这 些 特性 有 start_date、end_date 和 hours 等 属性 ， 以 及 assign 操 作 。 在 图 15-3b 中 ， 把 Employee 到 
Project 之 间 的 多 对 多 联系 拆 分 成 两 个 一 对 多 联系 ， 一 个 是 从 Employee 到 Assignment 的 联系 ， 另 
一 个 是 从 Project 到 Assignment 的 联系 。 虽 然 用 ODL 可 直接 确定 多 对 多 联系 ， 但 不 分 解 成 两 个 一 


对 多 联系 就 不 能 抓 住 属于 Assignment 的 特性 。 


proj_id 
proj_name 
priority 
begin_date 
completion_date 
skills_required 


total emp_hours( ) 


Employee 











emp_id 1 
name 1 


address. 


salary 
te hi 
date_hired start_date 
end_date 


hours 













gender 
skills 





assign(emp, proj) 





hire( ) 
fire( ) 
add_skili(new_ski 科 





a) 关联 类 的 多 对 多 联系 







Employee 


emp_id 
name 














projid 
proj_name 




































address 1 Workson pb ,| start date priority 
salary end_date begin_date 
date_hired A Allocated to hours completion_date 

















gender 
skills 


skills_required 


total_emp_hours( ) 






assign(emp, proj) 


hire( ) 
fire( ) 
add._skill(new_skill) 










b) 拆 分 成 两 个 --- 对 多 联系 的 多 对 多 联系 
图 15-3 员工 项 目 数据 库 的 UML 类 图 
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现在 可 以 把 图 15-3b 中 的 类 图 转换 成 下 列 ODL 模 式 : 


class Employee { 
( extent employees 
//emp_id 是 Employee 的 十 键 

key emp_ id) 

attribute short emp_ id; 

attribute string name; 

attribute Address address; 

attribute float salary; 

attribute Date date hired; 

attribute enum gender {male,female}; 
// 多 值 属性 

attribute Set <string> skills; 

relationship set <Assignment> works on inverse Assignment::allocated to; 
A/ 下 列 操作 不 返回 任何 值 

void hire(); 

void fire(); 

void add skill (string new skill); 
}; 


class Assignment { 
( extent assignments) 
attribute Date start date; 
attribute Date end date; 
attribute short hours; 
relationship Employee allocated to inverse Employee: :works_on; 
relationship Project for inverse Project::has; 
/ /下列 操作 给 项 目 指派 一 个 员工 
void assign (short emp,string proj); 


}; 


class Project { 

( extent projects 

//proj_id 是 Project 的 主键 
key proj id) 
attribute string proj id; 
attribute string proj name; 
attribute enum priority{low, medium, high}; 
attribute Date begin date; 
attribute Date completion date; 

// 多 值 属性 
attribute set <string> skills required; 
relationship set <Assignment> has inverse Assignment:: for; 
long total emp_hours!(); 

}; 


在 ODL 模 式 中 ,使 用 关键 字 keys 为 Employee 和 Project 指 定 了 候选 键 。 注意， 在 对 象 数据 库 
中 ， 每 个 Employee 或 Project 实 例 都 是 惟一 的 。 也 就 是 说 ， 需 要 明确 的 标识 符 来 强制 实现 对 象 的 
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惟一 性 。 但 是 ， 指 定 键 能 确保 属于 一 个 类 的 两 个 对 象 设 有 同样 的 键 属性 值 。 惟 一 性 的 作用 域 被 
限制 在 类 的 外 延 中 。emp_id 属 性 对 每 个 Employee 对 象 必 须 有 惟一 的 值 ，Project 的 proj_id 也 要 有 
同样 的 性 质 。ODL 还 支持 复合 键 ， 也 就 是 键 中 的 属性 可 有 多 个 。 例 如 ， 如 果 员 工 用 name 和 
address 来 惟一 标识 ， 那 么 可 用 下 列 语句 指定 键 : 


keys{name,address} 


上 面 的 模式 还 说 明了 怎样 定义 一 个 多 值 属性 ， 即 一 个 属性 在 给 定时 刻 可 以 有 多 个 值 。 
Employee 的 skil 属性 和 Project 的 skills_required 属 性 都 被 指定 成 字符 串 值 的 集合 。 
15.3.9 定义 概 化 

ODL 支 持 一 元 和 二 元 关联 联系 ， 但 不 支持 更 高 元 数 的 联系 。 关 键 字 extend 可 以 用 来 表示 概 
化 联系 。 图 15-4 显 示 的 UML 类 图 在 第 14 章 中 也 已 出 现 过 。 三 个 子 类 被 概 化 成 一 个 称 为 
Employee 的 超 类 ， 三 个 子 类 是 Hourly Employee、Salaried Employee 和 Consultant。 与 这 个 类 图 
相应 的 OPL 模 式 如 下 : 


class Employee { 

( extent employees) 
attribute short emp number; 
attribute string name; 
attribute Address address; 
attribute float salary; 
attribute Date date hired; 
void print label(); 

}; 


class HourlyEmployee extends Employee { 
( extent hrly_emps) 

attribute float hourly rate; 

float wages(); 


}; 


class SalariedEmployee extends Employee { 
( extent salaried emps) 
attribute float annual salary; 
attribute boolean stock option; 
void contribute pension(); 
}; 
class Consultant extends Employee { 
( extent consultants) 
attribute short contract number; 


attribute float billing rate; 
float fees!(); 


}; 


子 类 HourlyEmployee、 SalariedEmployee 和 Consultant 通 过 引进 新 的 特性 扩充 了 更 一 般 的 
Employee 类 。 例 如 ， HourlyEmployee 除 了 有 从 Employee 继 承 的 公共 特性 以 外 ， 还 有 hourly_rate 
和 wages 两 个 特性 。 所 有 这 些 类 (包括 Employee ) 都 是 具体 类 ， 即 它们 都 有 直接 的 实例 。 由 干 
子 类 是 非 完备 的 ， 因 此 Employee 是 一 个 具体 类 。 
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Employee 


emp_number 
name 
address 
salary 
date_hired 








print_label( ) 


employment, employment 、emptoyment 


type 


-7 -——— {disjoint, incomplete} 














Salaried 
Employee 


Hourly 
Employee 






Consultant 








contract_number 
biling_rate 


hourly_rate annual_salary 


stock_option 















contribute_pension( ) fees( ) 


图 15-4 表示 员工 概 化 的 UML 类 图 


15.3.10 定义 抽象 类 

图 15-5 是 称 为 Student 的 一 个 抽象 类 ， 它 可 以 没有 任何 直接 的 实例 。 也 就 是 说 ， 一 个 学 生 必 
须 是 Graduate Student 或 Undergraduate Student 的 实例 (应 注意 子 类 之 间 的 “完备 ”约束 )。 在 逻 
辑 模式 中 ， 可 以 用 如 下 方法 指定 Student 为 一 个 抽象 类 : 


abstract class Student { 
( extent students 
key stu number) 
attribute long stu number; 
attribute string name; 
attribute Date dateOfBirth; 
attribute Address address; 
attribute Phone phone; 
relationship set <CourseOffering> takes inverse CourseOffering::taken by; 
boolean register for (string crse, short section, string term); 
/ /抽象 操 作 
abstract float calc_tuition(); 


}; 


Student 的 calc_suition 操 作 是 抽象 操作 ,也 就 是 说 , 此 时 指定 的 是 操作 形式 而 不 是 它 的 实现 。 
我 们 用 关键 字 abstract 来 指定 抽象 类 和 抽象 操作 S。 子 类 用 下 面 的 方法 定义 : 
class GraduateStudent extends Student { 
( extent grads) 
attribute char undergrad major; 
attribute GRE gre score; 


昌 9DL 当 前 并 不 支持 类 和 操作 的 “抽象 ”关键 宁 . 本 书 使 用 的 语法 类 似 Java，Java 请 法 明确 地 区 分 了 抽象 类 / 
操作 和 具体 类 /操作 。 
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attribute GMAT gmat score; 
float calc tuition(); 
}; 


class UndergradStudent extends Student { 
extent undergrads) 

attribute SAT sat score; 

attribute ACT act score; 

float calc tuition!(); 


一 
















Student 
{abstract } 
stu_number 

name 

dateOfBirth 

address 

phone 










enrollment( ) 









register_for(crse, sec, term) 
calc_tuition( ) 






{disjoint, complete} 





Graduate 
Student 






Undergrad 
Student 






undergrad_major 
gre_score 
gmat_score 





sat_score 
act_score 






calc_tuition( ) 





calc_tuition( ) 





图 15-5 表示 学 生 概 化 的 UML 类 图 


由 于 这 两 个 子 类 都 是 具体 类 ， 因 此 这 两 个 子 类 中 的 calc_tuition 操 作 都 必须 是 具体 操作 。 因 
此 ， 虽 然 每 个 子 类 继承 来 自 Employee 的 操作 形式 ， 但 它们 仍 必 须 提供 具体 方法 。calc_tuition 操 
作 分 别 在 每 个 子 类 中 单独 指定 ， 因 此 体现 出 多 态 性 。 因 为 没有 使 用 关键 字 abstract， 所 以 它们 
是 具体 的 。 

15.3.11 定义 其 他 用 户 结构 

这 个 模式 定义 还 包含 用 户 定义 的 结构 ， 例 如 GRE、GMAT、SAT 和 ACT， 它 们 都 指定 了 各 
种 考试 得 分 的 类 型 。 在 属性 规范 中 可 以 使 用 Date 和 Time 这 种 预定 义 结构 ， 你 也 能 定义 用 于 相同 
目的 的 其 他 结构 。 用 于 考试 得 分 的 结构 的 定义 如 下 所 述 : 

struct GRE { 

Score verbal score; 
Score quant score;} 


Score analytical score; 


}; 


struct GMAT { 
Score verbal score; 
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Score quant score; 
}; 
struct SCORE { 
short scaled score; 
short percentile score; 
}; 
struct SAT {...}; 


struct ACT {...}; 


GRE 结 构 由 文字 测试 、 资 格 测试 和 分 析 测 试 三 部 分 组 成 ， 而 GMAT 结 构 没 有 分 析 测 试 。 每 
个 考试 得 分 的 类 型 都 是 称 为 SCORE 的 结构 ， 它 由 定 标 得 分 (例如 680) 和 百分比 得 分 (例如 
95% ) 组 成 。 


15.4 松 谷 家 具 公司 的 OODB 设 计 


在 第 14 章 已 为 松 谷 家 具 公 司 以 类 图 形式 (参见 图 14-18) 开发 了 一 个 概念 面向 对 象 模型 。 现 
在 把 这 个 概念 模型 转化 为 逻辑 ODL 模 式 ， 这 个 模式 可 以 用 来 为 公司 实现 面向 对 象 数 据 库 系统 。 

图 15-6 显 示 了 这 个 ODL 模 式 。 现 在 可 以 清楚 地 理解 类 图 中 每 个 类 、 属 性 、 操 作 和 联系 怎样 
映射 为 逻辑 模式 中 等 价 的 ODL 结 构 。 但 是 有 一 点 要 说 明 一 下 。 由 于 Address 和 Phone 的 结构 定义 
在 前 面 已 给 出 ， 因 此 在 图 中 未 显示 出 来 。SalespersonFax (推销 员 ) 的 Salesperson 属 性 的 类 型 
是 Phone， 表 示 这 个 属性 与 推销 员 的 Telephone 的 类 型 相同 。 还 有 ， 虽 然 类 图 将 任何 集合 指定 为 
有 序 的 ， 但 是 也 可 以 在 ODL 模 式 中 对 它们 进行 排序 。 例 如 ，Order 对 象 中 的 订单 行 的 集合 包含 
在 一 个 指定 为 一 个 列表 ， 表 示 订 单行 对 象 是 有 序 的 或 被 排序 过 的 。 


class Salesperson { class OrderLine { 

( extent salespersons { extent orderlines) 
key salespersonlD) attribute short orderedQuantity; 
attribute string salespersonlD; relationship Order contained_in inverse 
attribute string saiespersonName; Order::contains; 
attribute Phone salespersonF ax; relationship Product specifies inverse 
attribute Phone salespersonTelephone; Product::specified in 
relationship SalesTerritory serves inverse long orderlineTotal( ); 

SalesTerritory::represented_by; }; 

float totalCommission( ); class Product { 


} ( extent products 
class SalesTerritory { key productiD) 
{ extent salesterritories attribute string productiD; 
key territory{D) attribute string productDescr; 
attribute char territoryID; attribute char productFinish; 
attribute char territoryName; attribute float standardPrice; 
relationship set(Salesperson) represented_by relationship ProductLine betongs_ to inverse 
inverse Salesperson::serves; 。 ProductLine::includes; 
relationship set(Customer) consists_of inverse relationship set(OrderLine) specified_in 
Customer::does._ business_in; inverse OrderLine::specifies; 
}; relationship set(WorkCenter) produced. at 
inverse WorkCenter::produces:; 
relationship set(RawMaterial) uses inverse 
RawMaterial::used_in; 
float totalSales( ); 
boolean assignProd(string line); 


class Customer { 
( extent customers 
key customeriD) 
attribute string customerlD; 
attribute string customerName; 
attribute Address customerAddress; 


图 15-6 松 谷 家 具 公司 数据 库 的 ODL 模 式 
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attribute float balance. 

relationship set(SalesTerritory) 
does_business_in inverse 
SalesTerritory::consists_of; 

relationship list(Order) submits inverse 
Order:submitted_by; 

void maillnvoice(float amount); 

void receivePaymt(float amount); 


} 


class Order { 
({ extent orders 
key orderlD) 
attribute string orderlD; 
attribute Date orderDate; 
relationship Customer submitted_by inverse 
Customer:submits; 
relationship list(OrderLine) contains inverse 
OrderLine::contained_in; 
float orderTotal( ); 


}; 


class RawMaterial { 
( extent rawmaterials 
key materialiD) 
attribute string materiallD; 
attribute enum unitOfMeasure {piece, box, 
carton, Ib, oz, gallon, litre}; 
attribute float standardCost; 
relationship set(Product) used_in inverse Product::uses; 
relationship set(Supply) listed_in inverse Supply::lists; 
} 


class Supply { 
( extent supplies) 
attribute float unitPrice; 
relationship RawMaterial lists inverse 
RawMaterial::listed_in; 
relationship Vendor provided_by inverse 
Vendor::provides; 


} 


class Vendor { 
extent vendors) 
attribute string vendorName; 
attribute Address vendorAddress; 
relationship set(Supply) provides inverse 
Supply::provided_by:; 


图 15-6 


class ProductLine { 
( extent productlines) 
attribute string productLineName; 
relationship list(Product) includes inverse 
Product::belongs.to; 
float totalSales( ); 
} 


class WorkCenter { 
{ extent materiallD 
key workCenterID) 
attribute char workCenterlD; 
attribute string location; 
relationship set(Product) produces inverse 
Product::produced_by; 
relationship list(Employee) employs inverse 
Employee::works_in; 


class Employee { 
( extent employees 
key employeeiD) 
attribute string employeelD; 
attribute string employeeName; 
attribute Address employeeAddress; 
relationship set(WorkCenter) works_in inverse 
WorkCenter::employs; 
relationship set(skill) has inverse Skill::possessed._by:; 
relationship Employee supervised_by inverse 
Employee::supervises; 
relationship set(Employee) supervises inverse 
Employee::supervised_by; 
boolean checkSkills(string product); 
} 
class Skill{ 
( extent skills); 
attribute string skilName; 


relationship set(Employee) possessed_by inverse 
Employee::has; 





( 续 ) 


还 应 注意 ， 两 个 带 关联 类 的 多 对 多 联系 怎样 映射 为 两 个 一 对 多 联系 。 第 一 个 多 对 多 联系 是 
Order 和 Product 之 间 的 联系 ， 带 一 个 称 为 OrderLine 关 联 类 。 在 逻辑 模式 中 ， 定 义 参 与 两 个 一 对 
多 联系 的 OrderLine 类 ， 一 个 与 Order 联 系 ， 另 一 个 与 Product 联 系 。 另 一 个 多 对 多 联系 是 带 关 联 
类 Supplies 的 联系 ， 它 也 可 映射 为 两 个 一 对 多 联系 ， 一 个 是 Vendor 和 Supply 之 间 的 联系 ， 另 -- 


个 是 RawMaterial 和 Supply 之 间 的 联系 。 
15.5 创建 对 象 实例 


在 创建 一 个 类 的 新 的 实例 时 ， 也 指定 了 惟一 的 对 象 标识 符 。 可 以 用 一 个 或 多 个 惟一 的 对 象 
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标识 符 。 例 如 ， 可 以 用 下 列 方法 创建 一 个 新 的 课程 对 象 MBA 669: 
MBA669 coursel(); 
这 就 创建 了 Course 的 一 个 新 实例 。 对 象 标记 名 为 MBA669， 可 以 用 来 引用 这 个 对 象 。 此 时 
还 未 指定 这 个 对 象 的 属性 值 。 假 设 要 创建 一 个 新 的 学 生 对 象 ， 并 且 初 始 化 某 些 属性 。 
Cheryl student (name:"Cheryl Davis", dateOfBirth: 4/5/77); 
这 就 创建 了 一 个 新 的 学 生 对 象 ， 标 记名 为 Chery1， 并 且 初 始 化 了 两 个 属性 值 。 也 可 以 为 结 
构 中 的 属性 指定 值 ， 方 法 如 下 : . 
Jack student( 
name:"Jack Warner",dateOfBirth:2/12/74, 
address:{street address"310 College Rd",city"Dayton",state"Ohio",zip 45468}; 
Phone:{area code 937,personal number 228-2252}); 
对 于 多 值 属性 ， 可 以 指定 值 的 集合 。 例 如 ， 可 以 为 员工 Dan Bellon 指 定 其 技能 (skill), 方 
法 如 下 : 
Dan employee (emp_id: 3678, name:"Dan Bellon"， 
Skills:{"Database design", "O00 Modelling"}); 
还 可 以 很 容易 地 为 给 定 的 联系 中 的 对 象 之 间 建 立 链接 。 假 定 要 存储 Cheryl 在 1999 年 秋季 选 
修 三 门 课 这 个 事实 。 可 以 编写 以 下 语句 : 
Cheryl student (takes: {OOAD99F,Telecom99F, Java99F}); 
这 里 的 OOAD99F、Telecom99F 和 Java99F 是 三 个 课程 设置 对 象 的 标记 名 。 这 个 定义 创建 了 
三 个 从 标记 为 Cheryl 的 对 象 到 每 个 课程 设置 对 象 的 “takes” 联 系 的 链接 。 
考虑 另 一 个 例子 。 指 派 Dan 参 与 TQM 项 目 ， 可 以 编写 以 下 语句 : 
assignment (start_date: 2/15/2001,allocated to:Dan,for TQM); 
应 注意 ， 还 没有 说 明 指派 对 象 的 标记 名 。 这 些 对 象 将 由 系统 产生 的 对 象 标 识 符 来 标识 。 指 
派对 象 有 一 个 到 员工 对 象 (Dan) 的 链接 ， 还 有 一 个 到 项 目 对 象 (TQM ) 的 链接 。 
在 对 象 创建 时 就 被 指定 了 生命 周期 ， 可 以 是 暂时 的 或 持久 的 。 暂 时 对 象 只 在 某 个 程序 或 会 
话 正在 操作 时 存在 。 而 持久 对 象 一 直 存 在 到 它 被 明确 地 删除 为 止 。 数 据 库 对 象 总 是 持久 的 。 


15.6 对 象 查询 语言 


现在 介绍 对 象 查 询 语言 (OQL)，OQL 类 似 于 SQL92， 并 且 已 被 ODMG 采 纳 为 查询 OODB 
的 标准 。OQL 在 编写 查询 时 提供 了 许多 灵活 性 。 你 可 以 写 一 个 简单 的 查询 : 

Jack. dateOfBirth 
它 返 回 Jack 的 生日 ， 结 果 是 一 个 文字 值 。 又 如 ， 


Jack. address 
它 返 回 一 个 带 有 街道 地 址 、 城 市 、 州 和 邮 码 值 的 结构 。 如 果 只 是 要 查找 Jack 居 住 的 城市 ， 那 么 
可 以 用 如 下 方法 编写 


Jack. address. city 


和 SQL 一 样 ，OQL 也 使 用 Select-From-Where 结 构 来 编写 更 复杂 的 查询 。 例 如 ， 考 虑 图 15-2 
给 出 的 大 学 数据 库 的 ODL 模 式 。 我 们 来 观察 怎样 为 这 个 数据 库 编 写 OQL 查 询 。 由 于 SQL 和 OQL 
之 间 极 为 相似 ， 因 此 下 面 一 节 的 解释 是 相当 概括 的 。 为 了 进一步 解释 ， 可 以 先 回顾 第 7、8 章 关 
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于 SQL 和 第 14 章 关于 对 象 建 模 的 内 容 。 感 兴趣 的 读者 可 以 参考 Cattell 等 人 (2000) 关于 OQL 的 
介绍 。 
15.6.1 基本 的 检索 命令 

假设 我 们 想 要 查找 MBA664 的 名 称 (title) 和 每 学 时 收 款 数 (credit_hrs)。 与 SQL 一 样 ， 这 
些 属性 在 select 子 句 中 指定 ， 具 有 这 些 属 性 的 类 外 延 (extent) 在 from 子 句 中 指定 。 在 where 子 
句 中 ， 必 须 指定 要 满足 的 条 件 。 在 下 面 的 查询 中 ，Course 类 的 外 延 是 courses， 在 from 子 句 中 被 
约束 成 称 为 c 的 变量 。 在 select 子 句 中 说 明了 外 延 ( 即 数据 库 中 所 有 Course 实 例 的 集合 ) 的 属性 
crse_title 和 credit_hrs， 并 在 where 子 句 中 列 出 了 条 件 c.crse_code=“MBA664”。 

Select c.crse title,c.credit hrs 


from courses c 
where c.crse code= "MBA 664" 


由 于 只 需 处 理 一 个 外 延 ， 省 略 变 量 c 也 不 会 损失 清晰 度 。 但 是 ， 和 SQL 一 样 ， 如 果 涉 及 到 
县 有 公共 属性 多 个 类 时 ， 必 须 把 外 延 绑 定 到 变量 以 便 系统 能 清楚 地 为 所 选择 的 属性 标识 类 。 这 
个 查询 的 结果 是 一 个 带 有 两 个 属性 的 包 。 
15.6.2 在 select 子 句 中 包含 操作 

我 们 也 可 以 用 指定 属性 的 方法 调用 OQL 查 询 中 的 操作 。 例 如 ， 要 查找 学 生 John Marsh 的 年 
龄 ， 就 在 select 子 句 中 调用 “age” 操 作 。 


select s.age 
from students 5s 
where s.name= "John Marsh" 


如 采 假 定 只 有 一 个 学 生 名 为 John Marsh， 那 么 这 个 查询 返回 一 个 整数 值 。 除 了 文字 值 以 外 ， 
查询 还 可 以 返回 带 有 标识 的 对 象 。 例 如 ， 查 询 

select s 

from students s 

where s.gpa>=3.0 


返回 一 个 学 生 对 象 集合 ( 包 )， 这 些 学 生 的 gpa 值 大 于 等 于 3.0。 注 意 ， 我 们 在 where 子 旬 中 使 用 
了 gpa 操 作 。 

如 果 想 要 编写 同样 的 查询 ， 但 限制 学 生 不 居住 在 Dayton， 那么 可 以 像 在 SQL 中 一 样 使 用 
not 操 作 符 : 


Select s 

from students s 

where s.gpa>=3.0 

and not (s.address.city= "Dayton") 


如 采 不 使 用 “not”"， 也 可 以 用 下 列 形式 指定 新 的 条 件 : 
s. address. city 1= "Dayton" 

这 里 “! ”是 不 等 操作 符 。 
假定 我 们 想 查找 gpa 小 于 3.0 的 所 有 学 生 的 年 龄 。 这 个 查询 编写 如 下 : 
select s.age 


from students s 
where s.gpa<3.0 


15.6.3 查找 不 同 的 值 
前 面 的 查询 将 返回 整数 集合 。 有 可 能 有 多 个 学 生年 龄 相同 。 如 果 想 删 去 重复 的 值 ， 那么 可 
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以 使 用 关键 字 distinct 来 重新 编写 这 个 查询 : 
select distinct s.age 
from students s 
where s.gpa<3.0 


15.6.4 查询 多 个 类 

在 OQL 查 询 中 ， 也 可 以 像 SQL 那样 在 where 子 句 联结 多 个 类 。 在 构成 联结 的 基础 的 联系 在 
对 象 数据 模型 中 未 定义 时 ， 这 是 必需 的 。 当 联系 已 经 定义 时 ， 可 以 遍历 在 模式 中 定义 的 联系 的 
路 径 。 下 面 的 查询 查找 2001 年 秋季 开设 的 所 有 课程 的 课程 代码 。 

select distinct y.crse code 

from courseofferings x, 

x.belongs to y 
where x.term= "Fall 2001" 


由 于 一 门 课程 在 某 个 学 期 有 多 个 设置 ， 因 此 在 select 子 句 中 使 用 了 distinct。 在 from 子 名 中 ， 
使 用 从 CourseOffering 对 象 到 Course 对 象 之 间 的 “belongs_to” 联 系 指定 了 一 条 路 径 。 变 量 “y” 
被 绑 定 在 Course 对 象 中 ，Course 对 象 是 用 x.belongs_to 表 示 的 路 径 的 终点 。 

假设 我 们 想 要 妇 找 在 MBA664 课 程 第 1 班 注册 的 学 生 的 数目 。 注 册 操 作 在 CourseOffering 中 
是 有 效 的 ， 而 课程 代码 在 Course 中 也 是 有 效 的 。 下 面 的 查询 使 用 belongs_to 联 系 遍历 了 从 
CourseOffering 到 Course 这 条 路 径 。 变 量 “y” 表 示 x.belongs_to 路 径 的 终点 对 象 。 

select x.enrollment 

from courseofferings x, 

x.belongs to y 


where y.crse code= "MBA 664" 
and x.section= 1 


下 面 的 查询 遍历 了 两 条 路 径 ， 一 条 使 用 “takes” 联 系 ， 而 另 一 条 使 用 “belongs_to” 联 系 ， 
用 来 寻找 Mary Johns 选 修 的 所 有 课程 的 代码 和 名 称 。 
Select C.crse_code，c.crse title 
from students s 
s.takes x, 
xX.belongs toc 
where s.name= "Mary Jones" 


我 们 也 可 以 选择 一 种 由 多 个 组 件 组 成 的 结构 。 例 如 ， 下 面 的 查询 返回 以 age 和 gpa 作 为 它 的 
属性 的 一 个 结构 。 

select distinct struct(name: s.name. gpa:s.gpa) 

from students s 

where s.name= "Mary Jones" 


15.6.5 编写 子 查询 - 
在 select 语 句 中 还 可 以 使 用 一 个 select 语 句 。 为 了 选择 注册 人 数 小 于 20 的 课程 代码 、 课 程 名 
称 和 课程 设置 ， 可 以 编写 下 面 的 OQL 命 令 (参见 图 15-2 的 数据 库 设 计 ): 
select distinct struct (code: Cc.crse code,title: ¢c crse _ title， 
(select x 
from c.offers x 


where x.enrollment<20)) 
from courses c 
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enrollment 是 CourseOffering 对 象 的 一 个 操作 ， 并 且 Course 有 一 个 与 CourseOffering 的 1:M 联 系 
offers。 这 个 查询 返回 distinct 结 构 的 一 个 集合 ， 其 中 每 一 个 结构 包含 课程 代码 、 课 程 名 称 的 字 
符 串 值 以 及 注册 人 数 小 于 20 的 CourseOffering 对 象 的 一 个 对 象 标 识 符 。 

还 可 以 在 from 子 句 中 使 用 select 语 句 。 在 下 面 例子 中 ， 编 写 了 检索 年 龄 超过 30、gpa 值 大 于 
3.0 的 学 生 的 姓名 、 地 址 和 gpa 值 。 

select x.name, x.addrss, x.gpa 


from (select s from students s where s.gpa>=3.0)as x 
where x.age>30 


这 里 x 是 from 子 句 中 的 select 语 句 创建 的 外 延 的 别名 。 
15.6.6 计算 概要 值 

OQL 支 持 SQL 提 供 的 所 有 聚合 操作 : 计数 (count)、 求 和 (sum )、 求 平均 值 (avg)、 求 最 
大 值 (max ) 和 求 最 小 值 (min)。 例 如 ， 可 以 使 用 count 操 作 来 计算 大 学 里 学 生 的 人 数 : 

count (students) 
也 可 以 写成 下 面 的 查询 形式 : 

select count (*) 

from students s 


现在 考虑 员工 -项 目 数据 库 的 模式 。 假 设想 要 计算 公司 中 女性 员工 的 平均 工资 ， 可 使 用 avg 
的 数 来 完成 这 个 查询 : 

select avg salary female:avg (e.salary) 

from employees e 

where e.gender=female 


为 了 查找 付 给 员工 的 最 大 工资 ， 可 用 max 函 数 : 
max(select salary from employees) 
为 了 计算 所 有 员工 的 工资 总 和 ， 可 用 sum 函 数 : 
sum(select salary from employees) 
15.6.7 计算 分 组 概要 的 值 
像 在 SQL 中 一 样 ， 也 可 以 把 一 个 查询 响应 分 成 不 同 的 组 。 在 下 面 查 询 中 。 我 们 可 以 使 用 
group 命 令 按 性 别 male 和 female 分 成 两 组 。 这 个 查询 计算 这 两 组 中 每 一 组 人 的 最 小 工资 。 
select min(e.salary) | 
from employees e 
group by e.gender 
如 果 想 按照 项 目的 优先 级 对 它们 分 组 ， 可 以 编写 下 面 的 查询 。 
select * 


from projects p 


group by low: priority=low, 
medium: Priority=medium, 
high: priority=high 


这 个 查询 返回 三 组 项 目 对 象 ， 每 个 组 都 标 有 优先 级 : low、medium 和 high。 
对 分 组 的 限定 
像 SQL 一 样 ， 我 们 可 以 使 用 having 命 令 把 一 个 条 件 加 在 分 组 上 ， 或 在 分 组 上 进行 过 滤 。 例 
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如 ， 在 下 面 查询 中 ， 我 们 选择 只 在 那些 登录 超过 50 小 时 的 组 。 
Select * 
from projects p 
group by low: priority=low, 
medium: priority=medium, 
high: priority=high 
having sum (select x.hours from p.has X)>50 
15.6.8 在 查询 中 使 用 集合 
有 了 时 需要 判断 一 个 元 素 是 否 属 于 某 个 集合 。 要 完成 这 个 工作 ， 应 该 使 用 关键 字 in。 假 定 我 
们 想 要 查找 具有 数据 库 设 计 和 面向 对 象 建 模 技能 的 员工 的 标识 (ID) 和 姓名 。 技能 是 多 值 属性 ， 
即 它 是 一 个 值 的 集合 。 在 where 子 句 中 ， 可 以 使 用 “in” 来 检查 数据 库 设计 或 面向 对 象 建 模 是 
否 是 员工 技能 集合 的 一 个 元 素 。 
select emp id,name 
from employees 


where "Database Design" in skills 
or "00 Modeling" in skills 


类 似 地 ， 可 以 寻找 在 ID 为 TQM9 的 项 目 中 工作 的 员工 。 
select e.emp. id,e.name 
from employees e, 
e.works_ on a, 
a.for p 
where "TQM9" in p.proj id 


为 了 寻找 不 需要 C++ 程 序 设计 技术 的 项 目 ， 可 以 编写 下 列 形式 的 查询 : 
select * 

from projects p 

where not ( "C++ Programming" in p.skills_ reguired) 


最 后 ， 也 可 以 使 用 存在 量词 exists 和 全 称 量词 for all。 下 面 的 查询 用 来 寻找 至 少 被 指派 到 
个 项 目的 员工 。 
select e.emp id,e.name 
from employees e 
where exists e in(select x from assignment ys 
yY.allocated to x) 


where 子 句 中 的 select 语 名 返回 所 有 被 指派 的 员工 对 象 ( 即 他 们 的 标识 符 ) 的 集合 。 然 后 存 
在 量词 检查 被 限定 在 from 子 句 中 员工 对 象 是 否 存在 于 这 个 集合 中 。 如 果 在 ， 那 么 在 响应 中 就 应 
包含 这 个 员工 的 ID 和 姓名 ， 否 则 就 不 包含 。 

如 果 想 要 寻找 只 在 2001 年 开始 的 项 目 中 工作 的 员工 ， 那 么 可 使 用 for al 量词 编写 以 下 查询 


Select e.emp_id,e.name 
from employees e, 
e.works_on a 
where for all a: a.start date>= 1/1/2001 


在 from 子 句 中 ， 查 询 寻 找 通 过 “works_on” 联系 链接 的 员工 对 象 被 指派 的 对 象 的 集合 。 在 
where 子 句 中 ， 把 条 件 (start_data>=1/1/2001 ) 应 用 到 所 有 使 用 for all 量 词 的 集合 中 所 有 对 象 上 。 
只 有 满足 条 件 的 对 象 ， 查 询 响应 中 才 包 含 该 员工 的 ID 和 姓名 。 
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15.6.9 OQL 的 小 结 
本 节 介 绍 的 内 容 只 是 OQL 功 能 的 一 个 子 集 。 可 参考 Cattell 等 (2000)、Chaudhri 和 Zicart 
(2001) 的 著作 来 了 解 有 关 更 标准 的 OQL 的 特性 以 及 OQL 在 各 种 ODBMS 中 如 何 实 现 。 


15.7 当今 ODBMS 产 品 和 它们 的 应 用 


在 从 计算 机 辅助 设计 和 制造 ee 到 地 理 信息 系统 以 及 多 媒体 的 应 用 中 ， 组 织 对 
人 数据 ( 如 图 形 、 、 图 像 ) 的 需求 日 益 增长 ，ODBMS 产 品 得 到 了 普及 。 但 

， 业 内 分 析 家 认为 因特网 和 基于 Web 的 应 用 使 大 家 突然 重新 开始 对 ODBMS 感 兴 (King， 
1997: Watterson，1998 ) 。 虽 然 ODBMS 未 必 能 超过 RDBMS ， 但 ODBMS 仍 然 是 极 有 前 景 的 应 
用 产品 。 

ODBMS 人 允许 组 织 存储 各 种 各 样 与 它们 的 Web 站 点 有 关 的 组 件 (对 象 ， 参 见 Watterson ， 
1998 )。Web 上 复杂 数据 类 型 激增 以 及 存储 、 索 引 、 搜 索 和 操纵 这 些 数据 的 需求 的 迅速 增长 ， 
给 ODBMS 技 术 提 供 了 超过 其 他 数据 库 技术 的 机 缘 。 为 了 与 这 个 新 出 现 的 技术 抗衡 ， 像 Oracle、 
Informix、IBM 和 Sybase 等 主流 的 关系 数据 库 厂商 提出 了 通用 数据 库 (universal database ) 概念 ， 
也 称 为 对 象 关 系 DBMS (ORDBMS )， 这 是 一 种 可 能 的 备 选 方 案 。ORDBMS 是 一 种 混合 型 的 关 
系 DBMS， 设 法 将 复杂 数据 作为 对 象 来 处 理 (King，1997; 可 参见 附录 D )。 但 是 ， 这 些 系统 引 
起 了 对 性 能 和 规模 的 关注 。 此 外 ， 关 系 技术 和 对 象 技术 之 间 本 质 上 的 不 匹配 可 能 引起 许多 公司 
去 采用 纯 ODBMS 方 案 。 

适合 于 ODBMS 使 用 的 应 用 的 类 型 包括 物 材料 单数 据 (参见 图 14-16)、 支 持 导 航 访问 的 电 
信和 数据 、 医 疗 、 工 程 设计 、 金 融和 贸易 、 多 媒体 和 地 理 信息 系统 。 现 在 可 以 买 到 若干 商用 
ODBMS 产 品 。 例 如 ，ObjectStore ( 当今 市 场 主流 产品 )、Versant、GemStone、Objectivity 和 
Jasmine (参见 表 15-1)。 


表 15-1 ODBMS 产 品 





公 日 产 蝴 Web 网 站 
Computer Associates Jasmine http://www.cai.com/products/jasmine.htm 
Franz AllegroSCL http:/www .franz .com 
Gemstone Systems GemStone http://www.gemstone .com 
neoLogic neoAccess http://neologic .com 
Object Design ObjectStore http://www.odi.com 
Objectivity Objectivity/DB http://www.objectivity.com 
POET Software POET Object Server http://www.poet.com 
Versant Versant ODBMS http://www.versant.com 
与 ODBMS 产 品 有 关 的 其 他 链接 
Barry & Associates http://www.odbmsfacts.com 
Doug Barry's The Object Database Handbook http://wiley.com 
Object database newsgroup news://comp.databases. object 
Rick Cattell’s The Object Database Standard ODMG 3.0 http:/www.mkp.com 
Object Database Management Group http:/www.odmeg .org 
Chaudhri and and Zicari’s Succeeding with Object Databases http://www.wiley.com/compbooks/chaudhri 


Watterson (1998) 和 Barry&Association (www.odbmsfacts com/faq.htm) 提供 了 ODBMS 的 
现实 世界 应 用 的 例子 。Lucent 技 术 公 司 的 客户 支持 分 2 公司 使 用 GemStore 共 享 遍 及 全 球 的 顾客 交 
换 机 上 的 信息 。 摩 托 罗拉 公司 使 用 Objectivity 为 其 中 一 个 卫星 网 络 存 储 复杂 的 天 文 信息 。 法 国 
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的 退休 计划 管理 公司 Groupe Paradis 使 用 O, 来 访问 分 散在 几 个 数据 库 中 的 超过 100GB 的 数据 。 
GTE、Southwest Airlines 和 Time-Warnet 等 公司 使 用 ObjectStore 开 发 动态 Web 应 用 ， 用 于 收集 来 
自 空中 各 个 源 的 信息 。 芝 加 哥 股票 交易 所 使 用 Versant ODBMS 用 于 其 基于 央 特 网 的 交易 系统 。 
业内 专家 预言 ODBMS 是 新 兴 数 据 库 系统 中 最 有 前 途 的。 虽然 关系 DBMS 仍 然 可 能 在 传统 的 
业务 应 用 方面 保持 它们 占有 的 市 场 份额 ， 但 是 前 面 提 到 的 许多 应 用 的 数据 还 不 能 很 容易 地 放置 
到 二 维 数据 库 表 中 。 而 且 ， 从 各 个 表 中 访问 数据 需要 执行 联结 操作 ， 这 是 一 个 非常 慢 的 操作 。 


本 章 小 结 


本 章 介绍 了 怎样 使 用 对 象 定义 语言 实现 一 个 面向 对 象 数 据 库 系统 。 我 们 介绍 了 ODL 的 句法 
和 话 义 ， 介 绍 了 怎样 把 用 UML 类 图 形式 表示 的 概念 模式 转换 成 用 ODL 结 构 定 义 的 逻辑 模式 。 
而 且 , 学 习 了 怎样 通过 创建 新 实例 和 为 这 些 实例 指定 属性 值 来 形成 OODB。 本 章 还 介绍 了 OQL， 
这 是 一 种 为 查询 OODB 而 设计 的 语言 。 对 于 怎样 使 用 OQL 来 写 各 种 OODB 查 询 也 作 了 介绍 。 

本 章 还 讨论 了 ODBMS 适 用 的 应 用 的 类 型 。 简 要 描述 了 当今 使 用 的 ODBMS 适 用 的 某 些 应 
用 。 

第 14 章 提供 了 OODB 设 计 的 概念 化 框架 ， 而 本 章 提 供 了 使 用 兼容 ODMG 的 ODBMS 实 现 面 
向 对 象 数据 库 系 统 所 需要 的 知识 。 


本 章 复习 


集合 文字 词典 外 延 
列表 集 结构 化 文字 


1. 定义 下 面 每 一 个 术语 : 

a. 对 象 类 b. 联系 

c. 外 延 d. 原子 文字 

e. 结构 化 文字 

.比较 下 列 术 语 : 

a. 列表 ; 包 ; 词典 b. 集合 ; 数组 c. 集合 文字 ; 结构 化 文字 
. 试 解释 对 象 标 识 符 的 概念 。 对 象 标识 符 与 关系 系统 的 主键 有 什么 区 别 ? 

ODL 中 关键 字 struct 的 用 途 是 什么 ? 

ODL 中 关键 字 enum 的 用 途 是 什么 ? 

试 解释 图 15-2 的 用 于 许多 联系 的 术语 relationship set (联系 集 ) 的 意义 。 

试 分 析 通 过 有 瞳 指 属性 值 是 对 象 标 识 符 而 不 是 通过 使 用 联系 子 句 来 表示 ODL 中 的 联系 的 危 


MD 


Noon 


险 性 。 

8. ODL 中 关键 字 extends 的 意义 是 什么 ? 

9. 试 解释 SQL 和 OQL 的 相同 和 不 同 之 处 ? 
问题 和 练习 

1 试 为 下 列 问题 开发 相应 的 ODL 模 式 。 学 生 (student) 的 属性 包括 学 生 名 (studentName)、 
地 址 (address)、 电 话 (phone) 和 年 龄 (age)， 并 可 参与 多 项 校园 活动 。 大 学 (university) 应 
记载 一 个 学 生 参 与 某 活动 的 年 数 ， 并 且 在 每 学 年 末 发 活动 报告 给 学 生 ， 展 示 他 参与 各 种 活动 的 
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情况 。 

2. 为 一 个 地 产 公 司 (estate firm) 列 出 其 销售 的 房产 而 开发 一 个 ODL 模 式 。 下面 是 对 这 个 
组 织 的 描述 : 

。 公 司 在 许多 州 (states) 有 若干 销售 部 (sales offices )。 地 点 (location ) 是 销售 部 的 一 个 

属性 。 

。 每 个 销售 部 有 一 名 或 多 名 员工 。 员 工 (employee ) 的 属性 包括 员工 标识 (employeeID ) 

和 员工 名 (employeeName )。 一 个 员工 只 能 在 一 个 销售 部 工作 。 

* 在 每 个 销售 部 中 ， 有 一 名 员工 被 指定 为 经 理 。 一 个 员工 只 能 管理 他 所 在 的 销售 部 。 

“公司 列 出 所 销售 的 房产 (property )。 房 产 的 属性 有 房产 名 (propertyName ) 和 地 址 

(address ) 。 

"每 一 处 房产 必须 由 其 中 一 个 〈 只 有 一 个 ) 销售 部 销售 。 一 个 销售 部 可 以 销售 若干 个 房产 ， 

也 可 能 没有 任何 房产 。 

“每 一 处 房产 可 以 有 一 个 或 多 个 拥有 者 (owners )。 拥 有 者 的 属性 包括 拥有 者 名 

(ownerName) 和 地 址 (address)。 一 个 拥有 者 可 以 拥有 一 个 或 多 个 单位 房产 。 对 于 拥有 

者 拥有 的 每 个 房产 ， 用 percentOwned 属 性 指出 拥有 者 拥有 的 房产 的 百分比 。 

3. 试 为 你 熟悉 的 某 个 组 织 开 发 一 个 ODL 模 式 ， 例 如 男 童子 军 /女童 子 军 、 运 动 队 等 。 该 模 
式 中 应 至 少 包 含 四 个 关联 联系 。 

4. 试 为 下 列 情况 开发 一 个 ODL 模 式 (同时 描述 为 了 开发 一 个 完整 的 图 而 需 作出 的 假设 ): 

Stillwater 古 董 店 购买 和 销售 各 式 各 样 的 古董 (例如 家 具 、 珠 宝 、 瓷 器 和 衣物 )。 每 一 项 用 
项 目 号 惟一 地 标识 ， 并 且 用 描述 、 开 价 、 条 件 和 自由 评论 来 和 刻画。 古董 店 有 许多 不 同 的 客户 。 
这 些 客户 通过 古董 店 销售 或 购买 古董 。 某 些 客户 只 销售 古董 ， 某 些 客户 只 购买 十 董 ， 而 有 些 客 
户 既 销售 也 购买 。 每 个 客户 用 客户 编号 标识 ， 用 客户 名 和 客户 地 址 来 描述 。 在 古董 店 以 现货 形 
式 将 古董 销售 给 客户 时 ， 拥 有 者 应 记录 支付 的 佣金 、 实 际 销售 价格 、 销 售 税 (税金 为 零 表示 免 
税 销售 ) 和 销售 日 期 。 在 古董 店 购买 客户 的 古董 时 ， 拥 有 者 要 求 记录 购买 价值 、 购 买 日 期 和 购 
买 条件 。 

下 面 的 第 5~14 题 都 要 参考 图 15-2 中 的 ODL 模 式 。 为 这 些 问 题 编写 OQL 查询 。 

5. 查 找 在 2001 年 秋季 只 选修 一 门 课程 的 学 生 的 姓名 和 电话 号 码 。 

6. 查找 在 2001 年 冬季 和 2001 年 秋季 都 设置 的 课程 的 代码 和 名 称 。 

7. 查找 在 2002 年 冬季 设置 的 课程 MBA664 的 所 有 班 的 总 的 注册 人 数 。 

8. 查找 MIS385 课 程 的 预备 课程 (代码 和 名 称 )。 

9. 查找 居住 在 辛辛那提 并 且 在 2001 秋 季 选 修 MBA665 课 程 的 所 有 学 生 。 

10. 查找 MIS465 课 程 的 所 有 预备 课程 的 总 的 付款 时 数 。 

11. 按 学 生生 活 的 城市 分 组 查找 学 生 的 平均 年 龄 和 平均 gpa 值 。 

12. 查找 2002 年 冬季 Sean Chen 选 修 的 课程 的 代码 和 名 称 。 

13. 查找 选修 2002 冬 季 MBA665 课 程 的 一 班 和 二 班 的 所 有 学 生 的 姓名 和 电话 号 码 。 

14. 查找 在 2002 年 冬季 设置 的 每 小 时 收费 为 3 美元 的 课程 的 注册 人 数 最 少 的 班级 。 回 答应 根 
据 课程 分 组 ， 并 且 分 组 标识 应 该 是 crse_code。 
应 用 练习 

1. 访问 你 所 熟悉 的 公司 中 的 一 位 数据 库 管理 员 。 请 他 解释 采用 ODBMS 为 这 个 公司 带 来 的 
好 处 。 他 们 计划 使 用 ODBMS 吗 ?为 什么 ? 

2. 访问 本 教材 中 列 出 的 Web 网 站 。 访 问 ODBMS 供 应 商 的 几 个 站 点 。 为 你 找到 的 一 个 产品 
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写 一 份 概要 。 它 的 DDL 与 本 章 中 的 ODL 有 什么 区 别 ” 它 的 查询 语言 与 本 章 中 的 OQL 有 什么 区 
别 ? 供 应 商 声 称 他 们 的 产品 与 其 他 ODBMS 产 品 或 关系 型 产品 相 比 有 什么 优点 ? 
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项 目 案例 : 山 景 社区 医院 


回顾 第 14 章 中 项 目 案例 的 项 目 描述 ， 参 照 该 描述 及 项 目 练习 的 答案 回答 下 列 问题 。 
项 目 练习 

1. 针对 第 14 章 项 目 练习 1 的 答案 开发 一 个 ODL 模 式 。 

2. 写 出 使 用 这 个 模式 的 应 用 的 三 个 典型 的 间 题 ， 并 为 这 些 查询 编写 OQL 命 令 。 








附录 A ”E-R 建 模 工具 和 符号 


第 3 章 给 出 了 表示 数据 模型 的 符号 ， 第 4 章 扩 展 了 这 些 数据 模型 ， 并 在 全 书 范围 内 使 用 。 所 
使 用 的 各 种 描述 模型 的 软件 工具 不 同 ， 应 用 这 些 符号 的 方法 也 不 同 。 就 像 业务 规则 和 策略 不 是 
通用 的 一 样 ， 各 种 数据 建 模 工具 所 用 的 符 写 也 不 同 。 使 用 不 间 的 图 形 结构 和 方法 有 可 能 能 够 
(也 有 可 能 不 能 够 ) 表示 特定 的 业务 规则 。 

本 附 东 则 在 帮助 读者 对 建 模 工具 中 的 符 写 和 书 中 的 符号 进行 比较 。 四 种 常用 的 工具 包括 : 
Visible Analyst 7.4、Piatinum 的 ERwin3.5.2、Microsoft Access 2000 以 及 Oracle Designer 6.0。 表 
A-1a 和 A-1lb 显 示 了 这 四 种 工具 表示 实体 、 联 系 、 属 性 、 规 则 、 约 束 等 等 的 符号 。 另 外 ， 图 A-3 
到 图 A-6 包 含 了 每 -一 个 工具 的 屏幕 显示 。 

图 3-22 所 示 的 松 谷 家 具 公 司 (PVFC) 的 E-R 图 是 本 附录 例子 的 基础 。 该 图 是 使 用 本 书 介 绍 
的 符 避 系统 ， 根 据 第 3 章 包含 的 该 公司 的 业务 规则 画 出 的 数据 模型 。 表 A-1 给 出 了 四 种 软件 工具 
使 用 这 些 表示 方法 的 比较 。 


A.1 比较 E-R 建 模 规则 


如 表 A-1I 所 示 ， 创 建 表示 逻辑 数据 模型 的 E-R 图 时 所 用 的 符号 有 很 大 不 同 。 这 里 并 不 想 对 
各 种 工具 进行 深入 比较 ， 下 面 的 论述 使 用 图 3-22 中 描述 的 PVFC ERD 来 分 析 工 具 之 间 的 区 别 。 
特别 注意 在 描述 下 面 概 念 时 的 区 别 ， 多 对 多 联系 、 基 数 或 可 选 性 、 外 键 、 超 类 型 / 子 类 型 联系 。 
A.1.1 Visible Analyst 符号 

该 工具 很 灵活 ， 给 用 户 提供 用 图 形 描述 数据 模型 的 几 个 选择 。 有 5 种 可 供 选 择 的 符号 ， 包 
括 IDEFIX、Bachman、Crow's Foot、Arrow 和 UML。 表 A-1 使 用 Crow's Foot， 并 遵守 
Gane&Sarson 规 则 。 选 择 任 何不 同 选项 会 有 不 同 的 表示 功能 。 

实体 有 三 种 实体 类 型 符号 : 基本 、 关 联 和 属性 。 图 的 细节 可 以 灵活 地 显示 ， 例 如 ， 仅 显示 
实体 名 ， 或 实体 名 和 主键 ， 也 可 以 包括 所 有 属性 。 当 在 关联 实体 上 放置 -个 属性 时 ， 例 如 ， 表 
A-1 中 的 Order_Line， 它 的 符号 会 自动 改变 ， 实 体 名 的 旁边 会 出 现 指示 符 [AS]， 如 图 A-3 所 示 。 

联系 可 以 将 线 标记 为 单 向 或 双向 ， 并 且 可 以 有 多 个 线段 ， 可 以 选择 使 起 点 和 终点 相互 远 
离 。 根 据 所 选择 的 符号 ， 联 系 线 能 够 显示 基数 ， 存 储 一 个 实体 与 另 一 实体 相关 的 特定 数目 的 实 
例 。 联 系 线 可 以 表示 零 对 一 、 一 对 一 、 零 对 多 、 一 对 多 或 多 对 多 。 使 用 对 话 框 能 够 改变 已 有 联 
系 的 基数 。 递 归 联 系 表明 父亲 和 孩子 是 同一 个 实体 。 表 A-1a 中 的 例子 表明 ，Employee 可 以 管理 
很 多 员工 ， 但 并 不 是 所 有 的 员工 都 是 管理 人 员 ; 该 符号 表明 允许 使 用 空 值 。 父 亲 实 体 可 能 拥有 
多 个 孩子 ， 但 一 个 孩子 只 能 有 一 个 父亲 。 不 能 表示 这 样 的 规则 : 一 个 员工 只 能 有 一 个 管理 者 ， 
因为 可 选 符号 说 明 员 工 可 能 没有 管理 者 。 
A.1.2 Platinum ERwin 符 号 

这 里 可 以 选择 EDEFIX、IE (Information Engineering ) 或 DM (Dimensiona] Modeling) 符 
号 。 这 里 使 用 开 为 例 。 
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表 A-1a Hoffer、Prescott 和 和 McFadden 利用 4 种 软件 工具 的 建 模 符号 (常用 建 模 工具 符号 ) 
Hoffer-Prescott- Visible Analyst Platinum ERwin Microsoft Access Oracle Designer 
McFadden Notation 74 SS 2000 6.0 
] WERDOR TI PRODUCT LINE 
RT NDOR roduct_Line_ 
基本 实体 VEO OR VEND9 l= Product Line Name 
上 | 
ORDER LINE VE 
(没有 特殊 符号 ， (没有 特殊 符号 ， 
关联 实体 QRDER LINE 使 用 常规 实体 的 | ”使 用 常规 实体 的 
Uses 符号 符号 ) 
二 
SUPER-TYPE SUPERTYPE 
,用 在 和 Er 0 和 局 
天 生 > suBTFEA SUB]YpEe| 【没有 特定 符号 ) 
SUBTYPE AlISUBTYPE B 
SUBTYPE A | |SUBTYPE B|| | SUB-TYPE A| |SUB-TYPE B 
Supervises EMPLOYEE 
递归 实体 | 时 
EMPLOYEE 
EMPLOYEE PO 
| 
ORDER 
VENDOR a 
Vendor_ID .Order ID i J [i pn PRODUCT LINE 
属性 Vendor Name 多 Customer ID (FK) 器 Ucts I #PRODUCT_LINE_ID 
Vender Addrese Order Daie Product Line Name | ||* PRODUCT_LINE_NAME 
sk 

















表 A-1b Hoffer 、Prescott 和 McFadden 利 用 4 种 软件 工具 的 建 模 符号 (常用 建 模 工具 的 基数 /可 选 符号 ) 


Visible Analyst 
7.4 


Hoffer-Prescott- 
McFadden Notation 


( 若 设 有 基数 则 不 
可 用 ) 


Platinum ERwin 
人 


( 若 没 有 基数 则 不 


可 用 ) 


Microsoft Access 
2000 





( 若 没 有 基数 则 不 
可 用 ) 


(车 没有 基数 则 不 
可 用 ) 


( 若 没 有 基数 则 不 
可 用 ) 


(不 允许 ) 


(没有 可 选 符号 ) 





强制 
1:M 





可 选 
1:M 


(没有 可 选 符号 ) 





(没有 可 选 符号 ) 





Oracle Designer 
6.0 
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实体 ”如 果 在 标识 的 联系 中 ， 实 体 是 一 个 核子 (器 实体 )， 则 该 实体 为 依赖 实体 ， 用 圆 角 
矩形 框 表示 。 关 联 实体 也 用 该 方式 表示 。 用 户 选 择 使 键 了 迁移 到 主键 区 域 或 非 键 区 域 。 

联系 ”基数 选择 灵活 且 含 义 明 确 。 一 个 父亲 可 以 连接 到 “Zero, One, or More”， 用 空格 表 
示 ; “one, or More,” 用 PP 表示 ; “Zero, one” 由 Z 表 示 ; “Exactly” 表 示 出 现在 ERD 中 的 实例 
数目 。 多 对 多 联系 自动 解决 ， 在 逻辑 模型 上 显示 一 个 关联 实体 ， 并 且 多 对 多 联系 被 删除 。 父 亲 
和 孩子 的 递归 联系 表示 为 同一 个 实体 ， 一 个 员工 (一 个 Supervisor) 可 以 管理 很 多 员工 ， 但 并 
不 是 所 有 的 员工 都 是 管理 者 。 该 符号 表示 可 以 使 用 空 值 。-- 个 父亲 可 以 有 任意 数目 的 孩子 ， 但 
是 一 个 孩子 只 能 有 一 个 父亲 。 当 建立 联系 时 ， 键 自动 迁移 ， 并 且 外 键 表示 为 “(FK)”。 

该 图 是 从 ERwin 的 在 线 帮助 抓 取 的 ， 并 在 图 A-1 中 给 出 。 该 图 描述 了 该 产品 使 用 的 表示 基 
数 范 围 的 符号 。 
A.1.3 Microsoft Access 2000 符 号 

Access 不 像 画图 工具 那样 可 以 在 设计 数据 库 之 前 建立 逻辑 模型 。 为 了 在 数据 模型 中 描述 具 
有 属性 的 表 ， 以 及 建立 实体 之 间 的 联系 ， 必 须 在 数据 库 中 定义 这 些 带 有 属性 的 表 。 但 是 ， 当 用 
户 了 解 这 样 的 限制 后 ， 可 以 在 关系 屏幕 上 定义 表 ，MS Access 2000 用 户 应 该 能 够 利用 这 样 的 功 
能 建立 联系 。 

实体 ”因为 Access 关 注 的 是 数据 库 设计 而 不 是 数据 建 模 ， 所 以 不 存在 不 同 实体 类 型 的 特定 
表示 方法 ， 这 些 实体 类 型 包括 关联 实体 、 超 类 型 / 子 类 型 。 
IDEF1X Notation IE Notation DM Notation 


ldentifying “Non-idenrtifying identifying “Non-iclertifying llentifying “Non-idenrtifying 
Nuls No Nulis ls No Nuls Nuls No Nuls 


Nu 
One to zero, 中 十 | 十 
one, or more 


3 一 一 一 一 一 
2 一 一 一 一 一 


One to one 
ormore (P) 


| 
采 
+ 
| 
| 


p 


PP 


> 一 
Do 
2 一 一 一 一 一 
oD 

十 于 一 一 十 


| 
| 
1 


图 A-1 ERwin 基 数 /可 选 性 符号 


3 一 
IN 
> 一 一 一 一 
IN 


IN 


One to 
exactly (N) 


4 


果 
让 
| 
本 
ore a 中 十 
z 中 中 
中 


> 一 -一 
心 

》 一 一 一 一 

人 

> 一 一 十 > 一 一 一 一 





526 第 六 疤 分 了 奉 录 





联系 联系 描述 为 线 ， 通 过 连接 已 有 表 的 属性 画 出 联系 。 Access 在 安排 实体 使 其 显示 更 清楚 
这 方面 的 功能 有 限 。 可 以 编辑 联系 线 以 改变 基数 ， 但 是 没有 提供 表示 方法 以 区 别 可 选 性 。 当 联 
系 建立 起 来 时 ， 和 ERwin 不 同 ， 没 有 键 的 自动 了 迁移 。 必须 定义 属性 以 便 用 于 链接 。 一 对 一 或 一 
对 多 的 递归 联系 通过 以 下 方式 描述 : 在 工作 空间 的 两 个 表 中 放置 表 的 两 个 拷贝 ， 并 建立 该 表 的 
两 个 拷贝 之 间 的 链接 。 在 表 A-1a 中 显示 了 Access 自 动 标 为 EMPLOYEE_t_1 和 EMPLOYEE_t 的 
EMPLOYEE 的 两 个 拷贝 。 递 归 联 系 显示 为 一 个 链接 ， 它 链 接 EMPLOYEE_t_1 表 的 主键 和 
EMPLOYEE_t 中 的 “Employee-supervisor” 属 性 。 递归 联系 的 1 对 多 特性 显示 在 EMPLOYEE_t_1 
和 EMPLOYEE_t 之 间 的 链接 之 上 。 关 联 实体 〈 例 如 Order_Line ) 使 用 与 其 他 实体 相同 的 符号 表 
示 。 如 图 3-22 所 示 ，Order_Line 以 大 小 写 混合 的 方式 命名 ， 以 区 别 于 别 的 实体 〈 以 大 写字 母 来 命 
和 名)。 PRODUCT 和 ORDER 之 间 的 多 对 多 的 联系 通过 创建 具有 复 合 键 Order_ID 和 Product_ID 的 关 
联 实 体 Order_Line 来 解决 。 

A.1.4 Oracle Designer 6.0 符 号 

使 用 ERD 工 具 来 画图 时 ， 可 以 作 如 下 设置 : 只 显示 实体 名 ， 显示 实体 名 和 主键 ,或 者 显示 
实体 名 和 所 有 的 属性 。 

实体 不 存在 不 同 实体 类 型 的 特定 符号 ， 如 关联 实体 、 超 类 型 / 子 类 型 。 所 有 实体 都 表示 为 
圆 角 矩形 框 ， 属 性 显示 在 方 框 内 。 惟 一 标识 符 通 过 符号 “#” 表 示 ， 并 且 是 强制 的 。 强 制 属 性 
标记 为 “*”， 可 选 属性 标记 为 “””。 

联系 ” 线 必须 标 为 双向 ， 而 不 只 是 单 向 。 不 要 有 多 个 线段 ， 这 样 难以 操纵 和 对 齐 。 联 系 线 描 
述 了 基数 和 可 选 性 ， 通 过 首先 选择 所 需 的 基数 和 可 选 性 将 其 画 出 。 在 对 话 框 中 可 以 对 它们 进行 修 
改 。 可 选 性 使 用 表示 强制 联系 的 实 线 和 表示 可 选 联系 的 虚线 来 描述 。 在 一 个 二 元 联系 中 ， 根 据 联 
系 的 方向 ， 可 选 性 会 有 所 不 同 ， 两 个 实体 之 间 的 连 线 对 截 为 实 线 和 虚线 。 可 以 从 一 个 实体 开始 顺 
着 其 上 的 连 线 理解 联系 。 因 此 ， 在 图 A-6 中 ， 一 个 产品 必须 在 Work Center， 但 是 ，Work Center 不 
必 为 了 存在 而 制作 一 个 产品 。 基 数 通过 连 在 其 他 实体 上 的 基数 符号 来 理解 。 因 此 ， 一 个 顾客 可 以 
下 订单 也 可 以 不 下 订单 ， 但 如 果 已 经 下 了 一 个 MT Mandatoty to Optional] Relationship button 
订单 ， 就 必须 与 特定 的 顾客 相关 联 。 考 虑 
EMPLOYEE 实 体 ， 递 归 的 管理 联系 由 实体 上 的 
“ 猪 耳 ” 形 符号 描述 。 它 表明 一 个 Employee 可 
能 管理 一 个 或 多 个 员工 ， 并 且 那 个 员工 必须 被 
-个 员工 管理 。 至 于 多 重 基 数 是 0、1 还 是 多 ， 
其 剑 义 是 模糊 的 。 图 A-2 给 出 了 在 Designer 中 建 
立 联系 所 使 用 的 工具 条 按钮 。 

当 使 用 Oracle Designer 时 ， 在 使 用 工具 前 
仔细 和 完整 地 勾画 出 数据 模型 非常 重要 。 编 
辑 模型 很 具 挑战 性 ， 从 图 中 删除 一 个 对 象 并 
不 会 将 其 从 信息 库 中 自动 删除 。 1:1 (Mandatory to Mandatory) Relationship button 
A.2 工具 界面 和 E-R 图 的 比较 图 A-2 _ Oracle Designer 6.0 联 系 工具 条 


利用 表 A-1a 中 提 到 的 每 一 种 建 模 工具 ， 给 出 了 图 3-22 中 一 部 分 数据 模型 的 屏幕 抓 取 。 通 过 这 
些 图 ， 读 者 能 够 很 好 地 理解 这 些 符 号 如 何在 实际 中 使 用 。 图 A-3 用 Visible Analyst 7.4 画 出 ， 带 有 
Crow's Foot 和 Gane&Sarson 选 项 。 图 A-4 用 Platinum 的 ERwin 3.5.2 画 出 ， 并 选择 候选 项 。 参 照 完整 性 
可 以 可 选 地 显示 ， 但 不 包括 在 该 图 中 。 图 A-5a 是 Microsoft Access 2000 联 系 屏幕 图 ， 图 A-5b 是 使 用 
File 菜 单 下 的 “Print Relationships...” 而 生成 的 。 图 A-6 用 Oracle Designer 6.0 画 出 ， 并 选择 下 选项 。 


M-1 (Optiona! to Optional] Relationship button 

M:1 {Optional to Mandatory] Relationship button 
M:1 (Mandatory to Mandatory] Relationship button 
M:M {Optional to Optional] Relationship button 
M:M (Mandatory to Dptionall Relationship button 
1:1 (Mandatory to Optional) Relationship button 
1:1 {Optional to Optional) Relationship button 
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图 A-4 Platinum ERwin 3.5.2 界 面 








a) Microsoft Access 2000 界 面 一 一 联系 屏幕 
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b) Microsoft Access 2000 界 面 一 一 联系 报表 


图 A-5 Microsoft Access 2000 界 面 
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图 A-6 Oracle Designer 6.0 界 面 





附录 B 高 级 范式 


在 第 5 章 中 介绍 了 范式 并 首先 详细 论述 第 到 第 三 范式 。 对 大 多 数 数据 库 应 用 来 讲 ， 第 三 
范式 (3NF) 关系 已 经 足够 。 但 是 ，3NF 并 不 能 保证 消除 所 有 异常 。 第 5 章 中 说 过 ， 可 以 使 用 其 
他 几 个 范式 去 除 这 些 异常 ，Boyce-Codd 范 式 、 第 四 范式 和 第 五 范式 (参见 图 5-22)。 在 本 附录 
中 ， 主 要 讨论 Boyce-Codd 范 式 和 第 四 范式 。 

B.1 Boyce-Codd 范 式 

当 一 个 关系 有 多 于 一 个 的 候选 键 时 ， 处 于 第 范式 的 关系 也 会 导致 异常 。 例 如 ， 考 虑 图 B-1 
中 的 关系 STUDENT_ADVISOR。 该 关系 具有 下 列 属 性 : SID (学 生 ID)、Major、Advisor 和 
Maj_GPA。 图 B-1a 给 出 了 该 关系 的 样 例 数据 ， 图 B-1b 说 明了 函数 依赖 。 

STUDENT_ADVISOR 


Major Advisor | Maj_GPA 
Physics Hawking 4.0 
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a) 县 有 样 例 数据 的 关系 


| | | 








b) STUDENT_ADVISOR 中 的 国 数 依 赖 
图 B-1 第 三 范式 关系 ， 但 不 是 BCNF 


如 同 图 B-1b 所 示 ， 该 关系 的 主键 是 由 SID 和 Major 组 成 的 复合 键 。 因 此 ， 属 性 Advisor 和 
Maj_GPA 消 数 依赖 于 该 键 。 这 反映 了 如 下 约束 : 尽管 一 个 学 生 可 能 有 多 个 专业 ， 对 于 每 一 个 专 
业 ， 一 个 学 生 只 有 一 个 指导 老师 和 一 个 GPA。 

该 关系 中 的 第 一 个 玖 数 依赖 为 Major 困 数 依 赖 于 Advisor。 即 ， 每 一 个 指导 老师 只 指导 一 
个 专业 。 注 意 ， 它 不 是 传递 依赖 。 在 第 5 章 中 ， 本 书 将 传递 依赖 定义 为 两 个 非 键 属性 之 间 的 函 
数 依赖 。 相 比 之 下 ， 在 该 例子 中 ， 一 个 键 属性 (Major) 函数 依赖 于 一 个 非 键 属性 (Advisor)。 
B.1.1 STUDENT_ADVISOR 中 的 异常 

很 明显 ，STUDENT_ADVISOR 关 系 符合 第 三 范式 ， 因 为 不 存在 部 分 函数 依赖 和 传递 依赖 。 
然而 ， 由 于 Major 和 Advisor 之 间 的 函数 依赖 ， 该 关系 中 仍然 存在 异常 。 沽 虑 下 面 的 例子 : 
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1) 假定 将 物理 学 指导 教师 由 Hawking 赫 换 为 Einstein， 则 必须 在 表 的 两 行 ( 或 多 行 ) 进行 修 
改 (更 新 异常 )。 

2) 假定 要 在 表 中 插入 一 行 这 样 的 信息 : Babbage 指 导 Computer Science 这 门 课 程 。 当 然 ， 直 到 
至 少 一 个 专业 为 Computer Science 的 学 生 指 定 由 Babbage 指 导 后 ， 才 能 插入 这 行 信息 (插入 异常 )。 

3) 最 后 ， 如 果 学 生 号 为 789 的 学 生 退 出 学 校 ， 则 丢失 Bach 指 导 Music 这 条 信息 〈 删 除 异 常 )。 
B.1.2 Boyce-Codd 范 式 的 定义 

STUDENT_ADVISOR 中 的 异常 源 自 这 样 的 事实 : 有 一 个 决定 因子 (Advisor) 不 是 关系 中 
候选 键 。R. FE. Boyce 和 E. F. Codd 标 识 出 这 样 的 缺陷 ， 并 给 出 一 个 比 3NF 更 强 的 定义 来 矫正 这 样 
的 问题 。 当 且 仅 当 关 系 中 的 每 一 个 决定 因子 都 是 候选 键 时 ， 我 们 说 关系 符合 Boyce-Codd 范 式 
(Boyce-Codd Normal Form，BCNF)。STUDENT_ADYVISOR 不 符合 BCNF， 因 为 尽管 属性 
Advisor 是 一 个 决定 因子 , 但 它 不 是 一 个 候选 键 (只 有 Major 黄 数 依赖 于 Advisor)。 
B.1.3 将 一 个 关系 转换 为 BCNF 

使 用 简单 的 两 步 过 程 ， 可 以 把 符合 3NF 的 关系 (但 不 是 BCNF) 转换 为 符合 BCNF 的 关系 。 
图 B-2 说 明了 这 样 的 过 程 。 

第 一 步 ， 修 改 关系 使 关系 中 不 是 候选 键 的 决定 因子 转化 为 修订 后 关系 的 主键 的 一 部 分 。 卫 数 
依赖 于 那个 决定 因子 的 属性 变 为 一 个 非 键 属性 。 由 于 函数 依赖 ， 所 以 对 原始 表 的 重 构 是 合理 的 。 

对 STUDENT_ADVISOR 应 用 该 规则 的 结果 如 图 B-2a 所 示 。 决 定 因子 Advisor 变 为 复合 主键 
的 一 部 分 。 晴 数 依赖 于 Advisor 的 属性 Major 变 为 一 个 非 键 属性 。 

如 果 读 者 查看 图 B-2a， 会 发 现 新 的 关系 有 一 个 部 分 函数 依赖 (Major 函 数 依 赖 于 Advisor， 
Advisor 是 主键 的 一 部 分 )。 从 而 ， 新 的 关系 符合 第 -- 范 式 (但 不 符合 第 二 范式 )。 
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SID Advisor Major Maj_GPA 
1 . 


a) 修 ji 的 STUDENT_ADVISOR 关系 (2NF) 


SID Advisor Maj GPA Advisor Major 


b) 符合 BCNF 的 两 个 关系 
STUDENT ADVISOR 
Advisor | Maj GPA | Advisor 
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c) 具有 样 例 数据 的 关系 
图 B-2 转换 一 个 关系 为 BCNF 
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转换 过 程 的 第 一 步 是 分 解 关 系 以 消除 部 分 图 数 依赖 ， 这 企 第 5 章 介 绍 过 。 这 导致 两 个 关系 ， 


一 个 候选 键 (主键 )， 因 此 3NF 和 BCNF 是 等 价 的 。 

图 B-2c 给 出 了 带 有 样 例 数据 的 两 个 关系 (现在 名 为 STUDENT 和 ADVISOR )。 应 该 可 以 验 
证 ， 这 些 关 系 没 有 STUDENT_ADVISOR 中 的 异常 。 也 可 以 验证 ， 通 过 联结 关系 STUDENT 和 
ADVISOR ， 可 以 重新 创建 STUDENT_ADVISOR 关 系 。 

男 一 个 常见 的 建 反 BCNEF 的 情况 是 当 关 系 中 有 两 个 (或 多 个 ) 交合 的 候选 键 。 著 虑 图 B-3a 
中 的 关系 。 在 这 个 例子 中 、 有 两 个 候选 键 (SID，COURSE_ID) 和 (SNAME, COURSE _ID)。 
其 中 ，COURSE_ID 出 现在 两 个 候选 键 中 。 该 联系 的 问题 是 ， 除 非 学 生 已 经 开始 学 习 某 个 课程 ， 
否则 我 们 不 能 记录 学 生 数据 (SIC 和 SNAME )。 图 B-3b 说 明了 两 种 可 能 的 解决 方法 ， 每 -一 种 方 
法 都 创建 了 符合 BCNF 的 两 个 关系 。 

















a) 带 有 交 营 候选 键 的 关系 


| | [| 
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b) 符合 BCNE 的 -对 关系 


图 B-3 将 带 有 交 秋 候选 键 的 关系 转换 为 BCNF 





B.2 第 四 范式 


当 一 个 关系 符合 BCNF 时 ， 就 不 再 有 任何 函数 依赖 导致 的 异常 。 但 是 ， 可 能 会 存在 多 值 依 
赖 (在 下 面 定义 ) 导致 的 异常 。 例 如 ， 考 虑 图 B-4a 所 示 的 表 。 这 个 用 户 视图 显示 了 每 一 个 课程 ， 
讲授 某 门 课 的 教师 以 及 所 使 用 的 教材 。 在 该 表 中 ， 假 定 下 面 假设 成 立 : 

1 每 一 门 课程 都 有 一 个 定义 良好 的 教师 集合 (例如 ，Management 有 三 个 教师 )。 

2) 每 一 门 课程 都 有 一 个 定义 良好 的 教材 的 集合 (例如 ，Finance 有 两 本 教材 )。 

3) 一 门 给 定 课程 使 用 的 教材 不 依赖 于 该 门 课程 的 教师 。 例 如 ， 不 管 三 名 教师 中 谁 来 教授 
Management， 都 使 用 同样 的 两 本 教材 。 

在 图 B-4b 中 , 通过 在 每 个 空 单元 中 填 和 人 值 可 以 将 这 个 表 转 换 为 关系 。 该 关系 (OFFERING) 
符合 第 一 范式 。 因 此， 对 于 每 一 门 课程 ,教师 和 教材 的 所 有 可 能 的 组 合 都 出 现在 OFFERING 中 。 
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注意 ， 该 关系 的 主键 由 三 个 属性 组 成 : Course、Instructor 和 Textbook 。 因 为 除了 主键 外 没有 其 
他 决定 因子 ， 所 以 该 关系 实际 符合 BCNF。 然 而 ， 它 确实 包含 了 很 多 元 余数 据 ， 很 容易 导致 更 
新 异常 。 例 如 ， 假 如 要 在 Management 课 程 中 加 入 第 三 本 教材 (作者 为 Middleton)。 完 成 这 个 修 
改 需 要 在 图 B-4b 的 关系 中 新 加 入 三 行 ， 即 为 每 一 个 教师 加 入 一 行 《否则 该 教材 只 能 应 用 于 某 些 
教师 )。 
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b) 符合 BCNEF 的 关系 


图 B-4 多 值 依赖 的 数据 
多 值 依赖 

这 个 例子 中 所 示 的 依赖 类 型 称 为 多 值 依赖 (multivalued dependency ) ， 当 一 个 关系 至 少 有 
三 个 属性 时 (例如 ，A、B 和 C) 才 会 发 生 ， 并 且 对 于 A 的 每 一 个 值 ， 有 一 个 定义 良好 的 A 值 集 
合 和 B 值 集合 。 但 是 ，B 值 集合 不 依赖 于 C 值 集合 ， 反 之 亦 然 。 

为 了 从 一 个 关系 中 消除 多 值 依赖 ， 我 们 将 该 关系 分 解 为 两 个 新 关系 。 其 中 每 一 个 表 包 含 两 
个 属性 ， 它 们 在 原始 表 中 具有 多 值 联系 。 图 B-5 说 明了 对 图 B-4b 中 OFFERING 关 系 的 分 解 结果 。 
注意 ， 称 为 TEACHER 的 关系 包含 Course 和 Instructor 属 性 ， 因 为 对 于 每 一 个 课程 ， 都 有 一 个 定 
义 良 好 的 教师 集合 。 由 于 同样 的 原因 ，TEXT 包 含 属性 Course 和 Textbook。 但 是 ， 没 有 关系 包 
含 Instructor 和 Textbook ， 因 为 这 些 属 性 相互 独立 。 

如 果 一 个 关系 符合 BCNEF 并 且 不 包含 多 值 依赖 ， 则 它 符合 第 四 范式 (Fourth Normal Form， 
4NEF)。 读 者 很 容易 验证 图 B-5 中 的 两 个 关系 符合 4NF， 并 且 不 存在 前 面 描述 的 异常 。 间 样 能 
验证 ， 可 以 通过 联结 这 两 个 关系 重 构 原 始 表 (OFFERING )。 另 外 ， 注 意图 B-5 中 的 数据 少 于 图 
B-4 中 的 数据 。 为 了 简单 起 见 ， 假 定 Course 、Instructor 和 Textbook 都 是 等 长 的 。 因 为 图 B-4b 中 
有 24 个 数据 单元 ， 图 B-5 中 有 16 个 数据 单元 ， 所 以 4NF 表 节省 了 25% 的 空间 。 
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图 B-5 符合 4NF 的 关系 








B.3 更 高 级 范式 


至 少 定 义 了 两 个 更 高 级 范式 ， 即 第 五 范式 (5NF) 和 域 键 范式 (DKNF)。 第 五 范式 处 理 称 
为 “无 损 联结 ”的 特性 。 根 据 Elmasri 和 Navathe (2000), “这些 情况 极 少 发 生 ， 而 且 实 际 上 很 
难 检 而 出 来 。 因此 (也 因为 SNE 的 定义 非常 复杂 )， 本 书 并 不 论述 SNF。 

域 键 范式 《DKNF) 试图 定义 一 个 考虑 到 所 有 可 能 的 依赖 类 型 和 约束 的 “终极 范式 ” 
(Elmasri 和 Navathe ，2000)。 尽 管 DKNF 的 定义 非常 简单 ， 据 作者 所 言 “ 其 实际 用 途 非 常 有 限 ”。 
因此 ， 本 书 并 不 论述 DKNF。 

更 多 的 信息 参见 Elmasri 和 Navathe (2000) 以 及 Dutka 和 Hanson (1989) 的 著作 。 
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附 孙 C 数据 结构 


数据 结构 是 任何 物理 数据 库 体系 结构 的 基本 构造 块 。 无 论 使 用 什么 样 的 文件 组 织 或 DBMS ， 
都 要 使 用 数据 结构 连接 相关 的 数据 。 虽 然 许 多 现代 DBMS 隐 藏 了 基本 的 数据 结构 ， 但 是 ， 调 整 
物理 数据 库 仍 然 需 要 理解 数据 库 设 计 人 员 在 数据 结构 方面 所 能 作出 的 选择 。 本 附录 介绍 所 有 数 
据 结构 的 基本 元 素 ， 并 概述 存储 和 查找 物理 数据 元 素 的 常用 模式 。 


C.1 指针 


在 第 6 章 已 介绍 过 指针 。 如 第 6 章 所 述 ， 指 针 用 于 引用 其 他 数据 的 地 址 。 实 际 上 ， 有 大 类 指 
针 (如 图 C-1 所 示 )。 

1. 物理 地 址 指针 

这 种 指针 应 包含 被 引用 数据 的 实际 的 、 完 全 解析 的 磁盘 地 址 (设备 、 桩 面 、 磁 道 和 块 )。 
物理 指针 是 定位 其 他 数据 的 最 快 的 方式 ， 但 局 限 性 也 最 大 ， 因 为 如 果 被 引用 数据 的 地 址 改变 ， 
那么 指向 这 个 数据 的 所 有 指针 也 必须 改变 。 物 悍 指 针 通 常 在 具有 网 状 和 层次 数据 座 体 系 结构 的 
遗留 数据 库 应 用 中 使 用 。 

2. 相对 地 址 指针 

这 种 指针 应 包含 关联 数据 与 某 个 基地 址 ( 即 开 始点 ) 的 相对 位 置 (或 “ 偏 移 量 ” )。 相 对 地 
址 可 以 是 字 节 位 置 、 记 录 或 行 的 数目 。 相 对 指针 的 优点 是 ， 在 整个 数据 结构 改变 位 置 时 ， 对 这 
个 结构 的 所 有 相对 引用 可 保持 不 变 。 大 多 数 DBMS 都 使 用 相对 指针 。 它 常常 用 于 索引 中 ， 其 中 
索引 键 与 具有 该 键 值 的 记录 的 行 标识 符 (相对 指针 的 -种 类 型 ) 相 匹 配 。 

3, 还 辑 键 指针 

这 种 指针 应 包含 关于 关联 数据 元 素 的 有 意义 的 数据 。 逻 辑 指 针 必 须 通 过 表 查 找 、 索 引 搜 索 
或 数学 计算 转换 成 物理 指针 或 相对 指针 ， 以 便 真正 找到 被 引用 的 数据 。 关 系数 据 库 中 的 外 键 通 
常 是 逻辑 键 指针 。 

表 C-1 总 结 了 这 三 类 指针 的 主要 特点 。 在 数据 库 中 ， 数 据 库 设计 人 员 可 以 根据 不 同 的 情况 
选择 不 同类 型 的 指针 。 例 如 ， 关 系 中 的 外 键 能 用 这 三 类 指针 中 的 任何 一 类 来 实现 。 此 外 ， 在 数 
据 库 被 破坏 时 ， 了 解 使 用 哪 种 类 型 指针 的 数据 库 管 理 员 能 够 很 快 重建 数据 库 内 容 之 间 被 破坏 的 
链接 。 

表 C-1 各 类 指针 的 比较 








网 指针 的 类 型 
| 物理 指针 相对 地 址 指针 逻辑 键 指针 

形式 实际 辅 存 (磁盘) 地 址 ”与 参照 点 (文件 开始 处 ) 的 偏 移 重 。 有 意义 的 业务 数据 

访问 速度 最 快 中 等 最 慢 

对 数据 移动 的 敏感 性 基 强 只 对 相对 位 图 改 恋 比较 敏感 最 小 

对 破坏 的 敏感 性 非常 敏感 非常 敏感 通常 能 很 容易 地 重 构 


罕 间 需求 半 定 ， 通 常 较 少 变化 . 通常 最 少 变化 ,通常 坡 多 
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b) 文件 中 第 R 个 记录 的 相对 地 址 指针 
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0) 带 键 记 东 的 池 辑 键 指 针 
图 C-1 指针 的 类 型 


C.2 数据 结构 的 构造 块 


所 有 的 数据 结构 都 由 连接 和 定位 数据 的 几 个 可 选 的 基本 构造 块 (building block) 构 成 。 连 接 方法 
允许 在 相关 的 数据 元 素 之 间 移 动 。 定 位 方法 允许 结构 内 的 数据 首先 被 放置 或 存储 ， 然 后 被 找到 。 

对 于 数据 的 连接 元 素 只 有 两 种 基本 方法 : 

1. 地 址 顺序 连接 

一 个 后 继 ( 或 相关 ) 元 素 被 放 在 与 当前 元 素 紧 邻 的 物理 存储 空间 中 ( 如 图 C-2a 和 C-2c 所 示 )。 
车 读 取 整 个 数据 集 或 按 存储 顺序 读 下 一 个 记录 时 ， 地 址 顺序 连接 的 性 能 最 好 。 反 之 ， 对 于 检索 
任意 记录 和 数据 更 新 添加、 删除 和 修改 ) 操作 ， 地 址 顺序 连接 的 效率 很 低 。 由 于 必须 保持 物 
理 顺 序 ， 一 般 要 求 重新 组 织 整个 数据 集 ， 因 此 更 新 操作 也 很 低 效 。 

2. 指针 顺序 连接 

为 了 标识 后 继 (或 相关 ) 数据 元 素 的 位 置 ， 必 须 在 一 个 数据 元 素 内 存储 一 个 (或 多 个 ) 指 
针 (如 图 C-2b 和 C-2d 所 示 )。 对 于 数据 更 新 操作 ， 指 针 顺 序 是 比较 有 效 的 ， 这 是 因为 只 要 保持 
相关 数据 之 间 的 链接 就 能 查找 任何 位 置 的 数据 。 指 针 硕 序 方式 的 另 一 个 主要 特点 是 在 同样 的 数 
据 集 内 通过 设置 不 同 的 指针 保持 许多 不 同 的 顺序 链接 。 我 们 简单 地 回顾 -一 下 指针 顺序 方式 的 几 
种 常用 的 形式 (线性 数据 结构 )。 

此 外 ， 与 连接 机 制 有 关 的 数据 放置 有 两 种 基本 方法 : 

1. 数据 直接 放置 

这 种 连接 机 制 把 一 个 数据 项 直接 与 其 后 继 (或 相关 ) 数据 项 相 链 接 ( 如 图 C-2a 和 C-2b 所 示 ) 。 
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直接 放置 具有 在 遍历 一 个 连接 时 可 快速 找到 数据 的 优点 。 其 缺点 是 实际 的 数据 分 散在 大 部 分 的 
磁盘 存储 器 空间 内 ， 这 是 因为 实际 的 空间 必须 在 连接 元 素 之 间 分 配 。 

2. 数据 间接 放置 

这 种 连接 机 制 将 指针 链接 到 数据 ， 但 不 是 真正 的 数据 (如 图 C-2c 和 C-2d 所 示 )。 间 接 放置 
的 优点 是 扫描 具有 指定 特征 数据 的 数据 结构 时 更 加 有 效 ， 这 是 因为 通过 关键 特征 的 紧 竣 入 口 和 
指向 关联 数据 的 指针 就 能 完成 扫描 。 还 有 ， 连 接 和 数据 的 放置 是 分 离 的 ， 因 此 数据 记录 的 物理 
组 织 可 以 采用 最 合适 的 方式 〈 例 如 ， 对 于 排序 顺序 可 采用 物理 顺序 )。 其 缺点 是 在 检索 引用 的 
数据 和 检索 数据 时 都 需 额外 的 访问 时 间 ， 同 时 指针 也 需要 额外 的 空间 。 

任何 数据 结构 、 文 件 组 织 或 数据 库 体系 结构 都 能 使 用 这 四 种 基本 方法 的 组 合 方式 。 


[到 | 


a) 地 址 顺序 连接 (顺序 ) 
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c) 地 址 顺序 ， 数 据 问 接连 接 ( 键 索引 ) 


指 问 元 素 上 指 向 指针 2 。 指向 元 素 3 ， 指 | 指向 指针 4 ， 
的 指针 。 :的 指针 | 的 指针 | 的 指针 x | 
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| ;的 指针 kb | 
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一 一 连接 指针 
一 一 一 位 加 指针 
d) 指针 顺序 ， 数 据 问 接连 接 ( 链 键 索引 ) 
图 C-2 基本 定位 方法 








C.3 线性 数据 结构 


指针 顺序 数据 结构 适合 于 存储 易 变 的 数据 ， 这 些 数据 可 企 运作 数据 库 中 找到 。 事 务 数据 
(例如 顾客 订单 和 个 人 修改 请 求 ) 和 历史 数据 (例如 产品 价格 和 学 生 班级 注册 ) 构成 了 运作 数 
据 库 的 主体 部 分 。 还 有 ， 由 于 运作 数据 库 的 用 户 以 多 种 不 同 顺序 查看 数据 (例如 以 订单 日 期 、 
产品 编号 或 顾客 编号 为 序 查 看 顾客 订单 )， 在 同样 数据 上 保持 不 同 的 指针 链 的 这 种 能 力 可 以 支 
持 这 个 数据 集 上 的 一 大 批 用 户 需 求 。 

使 用 线性 数据 结构 处 理 数据 更 新 的 功能 如 图 C-3 所 示 。 图 C-3a 显 示 了 怎样 轻松 地 把 一 个 新 
记录 插入 到 线性 (或 链 式 ) 结构 中 。 这 张 图 表示 一 个 产品 记录 文件 。 为 简单 起 见 ， 每 个 产品 记 
录 只 用 一 个 产品 编号 和 按 产品 编号 顺序 指向 下 一 个 产品 记录 的 指针 来 表示 。 假 设 有 一 个 存储 在 
有 效 位 置 (S) 的 新 记录 ， 通 过 改变 与 位 置 R 和 S 的 记录 有 关 的 指针 可 以 把 这 个 新 记录 插入 到 链 
中 。 在 图 C-3b 中 ， 删 除 -一 个 记录 也 一 样 容易 ， 要 改变 位 置 R 的 记录 的 指针 即 可 。 虽然 存储 指 
针 需 要 额外 的 空间 ， 但 ， 与 存储 产品 的 所 有 数据 (产品 编 写 、 描 述 、 现 有 数量 、 标 准 价格 等 等 ) 
的 空间 相 比 ， 这 个 空间 还 是 最 小 的 。 按 这 个 结构 给 出 的 产品 编号 来 查找 记录 是 委 容易 的 ， 但 是 
如 果 有 还 辑 顺序 记录 在 磁盘 上 分 隔 存储 ， 那 么 顺序 检索 记录 的 实际 时 间 是 很 长 的 。 


R X Y 
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b) 删除 


图 C-3 维护 指针 顺序 结构 
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这 个 例子 简要 地 说 明了 线性 数据 结构 ， 下 面 考 虑 这 种 结构 的 四 种 情况 : 栈 、 队 、 排 序 表 和 
多 表 。 人 在 本 节 结 尾 ， 我 们 将 给 出 有 关 线 性 、 链 式 数 据 结 构 给 出 几 点 忠告 。 
C.3.1 栈 

栈 具 有 所 有 记录 的 插入 和 删除 操作 均 在 数据 结构 的 同一 端 热 行 的 性 质 。 栈 具有 后 进 先 出 
(LIFO) 性 质 。 栈 的 一 个 就 像 是 食堂 里 的 一 悚 盘子 。 人 在 业务 信息 系统 中 ， 栈 用 于 保留 无 优先 权 
和 不 排序 的 记录 (例如 与 同一 个 顾客 订单 有 关 的 行 项 )。 
C.3.2 队列 

队列 具有 所 有 插入 均 发 生 一 端 ， 而 所 有 删除 均 发 生 在 另 一 端的 性 质 。 队 列 具 有 先进 先 出 
(FIFO) 性 质 。 队 列 就 像 是 超市 里 一 支 结账 队伍 。 在 业务 信息 系统 中 ， 队 列 用 于 以 插入 的 顺序 
来 维护 记录 的 列表 。 例如， 图 C-4 显 示 了 松 谷 家 具 公 司 中 以 订购 单行 (Order Line) 记录 来 遍历 
公共 的 产品 (Product) 记录 的 链 队列 。 


Quantity_ Oldest_ Newest_ 











Product number Description Price on_hand Order Line Order_Line 
Produot Sat=P 0100 TABLE 500.00 42 x z 
] | 
Quantity Extended_ Next_ Prior_ 


X QOrder number Product_number ordered price Order Line Order Line 


o100 1 | so000 g 
Order Line Y [一 一 一 ”| 




















2833 0100 2 1000.00 ea Y 


图 C-4 带 双向 指针 的 队列 的 例子 


企 这 个 例子 中 ，Product 记 录 在 数据 结构 中 是 链 首 结 点 。Oldest_order line 字 段 值 是 指向 产 
上 品 0100 中 最 早 的 (第 一 个 输入 的 ) Order Line 记 录 的 指针 。 Order_Line 记 录 中 的 Next_order_line 
字段 包含 一 个 以 时 序 顺 序 指向 下 一 个 记录 的 指针 。 指 针 中 的 $9 称 为 空 指针 ， 表 示 链 尾 。 

这 个 例子 还 介绍 了 双向 链 的 概念 ， 即 有 向 前 指针 和 后 向 指针 。 next 和 prior 指 针 的 好 处 是 记 
录 中 的 数据 可 以 在 前 向 或 后 向 上 进行 检索 和 引用 ， 并 且 维 护 链 的 代码 实现 起 来 要 比 单 向 链 容易 。 
C.3.3 排序 表 

排序 表 具 有 插入 和 删除 可 发 生 在 表 中 的 任何 地 方 、 且 记 录 必 须 以 键 字段 值 的 逻辑 顺序 维护 
的 性 质 。 排 序 表 就 像 是 电话 目录 。 在 业务 信息 系统 中 ， 排序 表 经 常 出 现 。 图 C-5a 显 示 了 一 个 与 
顾客 (Customer) 记录 有 关 的 订单 (Order) 记录 的 单 向 、 指针 顺序 排序 的 表 ， 其 中 的 记录 是 
据 Delivery_date 排 序 的 。 

维护 一 个 排序 表 比 维护 一 个 栈 或 队列 更 复杂 ， 这 是 因为 插入 和 删除 可 以 发 生 在 链 的 任何 地 
方 ， 并 且 这 条 链 上 可 以 有 零 个 或 多 个 已 存在 的 记录 ，。 如 果 要 保证 插入 和 删除 总 是 发 生 在 链 的 中 
间 ， 那么 通常 就 要 把 链 的 第 一 个 记录 和 最 后 一 个 记录 置 为 哑 (dummy) 记录 (参见 图 C-5b)。 
图 C-5c 显 示 了 向 图 C-5b 的 排序 表 中 插入 一 个 新 Order 后 的 结果 。 为 了 执行 插入 ， 必 须 从 指针 
First_order 的 地 址 处 开始 扫描 列表 。 一 旦 找到 链 中 的 真正 位 置 后 ， 还 必须 有 一 条 规则 ， 以 决定 








如 果 表 中 允许 有 重复 的 键 值 ， 那 么 这 个 重复 键 值 的 记录 应 该 存储 在 什么 位 置 。 通 党 
值 的 记录 将 成 为 这 些 重复 键 值 记 录 中 的 第 一 个 ， 这 样 只 需 最 少 的 扫描 。 
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Y | 
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3217 021283 | 031283 850.00 





NEW = R 
New Order 3318 022483 | 031083 1100.00 | 


a) 在 新 的 Order 插 入 前 ， 并 且 第 个 和 最 后 “个 Order 记 录 都 不 是 哑 记 录 
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b) 在 新 的 Order 插 入 前 ， 并 此 第 -- 个 和 最 后 一 个 Order 记 录 都 是 哑 记 录 
图 C-5 排序 表 的 例子 


， 带 重复 键 
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Customer_ Customer First_ 
Customer_number address details order 


Customer Start =P 6726 123 Spruce -|| 


Order Delivery_ Total_ Next_ 
A Order_number date date amount order 


Dummy First 
1378 121782 | 121882 650.00 
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2386 121982 1275.00 


or [em ov [| 


















NEW =R 
New Order 031083 1100.00 | z® | 





0) 在 新 的 Order 插 入 后 〔 紧 舍 指 针 小 网 轿 中 的 号 码 指 出 在 改变 指针 值 的 相关 维护 过 程 中 步 又 的 编号 ) 
图 C-5 ( 续 ) 


如 果 使 用 支持 链 ， 特 别 是 支持 排序 表 的 文件 组 织 或 DBMS 时 ， 那 么 不 一 定 需要 编写 维护 列 
表 的 代码 。 相 反 ， 这 个 代码 将 在 你 使 用 的 技术 中 存在 。 在 你 的 程序 中 ， 只 要 发 出 插入 、 删 除 或 
更 新 命令 ， 那 么 支持 的 软件 将 会 完成 链 的 维护 工作 。 图 C-6 包 含 了 在 图 C-5b 的 排序 表 中 插入 一 
个 新 记录 时 所 需要 的 代码 的 概要 。 在 这 个 概要 中 ， 位 置 变 量 PRE 和 AFT 分 别 用 于 保存 新 的 Order 
记录 的 前 驱 和 后 继 的 值 。 第 7 步 写 在 方 括号 内 ， 表 示 如 果 需 要 时 重复 键 值 将 会 在 什么 地 方 出 现 。 
符号 “一 ”表示 左边 变量 中 的 值 将 用 右边 变量 中 的 值 替换 。 图 C-5 中 改变 指针 值 的 第 8 步 和 第 9 
步 显 示 了 该 图 的 例子 中 哪 一 个 指针 将 被 改变 。 但 你 很 可 能 缺乏 桌面 检查 这 个 子 程序 来 通过 人 工 
执行 去 看 这 些 变量 如 何 被 置 值 和 改变 。 


Establish position variables beginning values */ 

PRE < 二 First_order(START) 

AFT 二 Next_order(PRE) 

Skip/scan through chain until proper position is found */ 
DO WHILE Delivery_date(AFT) < Delivery_date(NEW) 
4 PRE «AFT 

5 AFT e- Next_order(AFT) 


ENDO 

[if Delivery_date(AFT) = Delivery_date(NEW) then indicate a Duplicate Error and 
terminate procedure] 

Weld in new chain element */ 

Next_order(PRE) ~ NEW 

Next_order(NEW) 二 AFT 


图 C-6 记录 插入 代码 概要 
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C.3.4 多 表 

多 表 数 据 结构 是 在 同样 的 记录 之 间 保 持 多 种 顺序 的 数据 结构 。 这 样 ， 同 样 的 记录 中 存在 多 
条 链 ， 并 且 不 需 重复 存储 就 能 以 某 种 顺序 来 扫描 这 些 记录 。 要 在 灵活 的 访问 代价 和 额外 的 存储 
空间 及 每 条 链 的 维护 工作 之 间作 出 权衡 。 使 用 多 表 ， 有 可 能 遍历 一 个 关联 时 转 到 另 一 个 关联 。 
例如 ， 在 根据 给 定 的 顾客 (Customer) (一 个 表 ) 访问 订单 (Order) 记录 时 ， 我 们 可 以 找 与 给 
定 的 订单 记录 同一 天 交付 的 所 有 订单 记录 。 这 样 的 多 表 如 图 C-7 所 示 。 


TOMER A 
[ousoven A| co CUSTO 





_order 














ORDER 1 | oor"| Next_ oe Next_ 站 ,| 
CUSTOMER 中 oer] same 和 [oer ,| 


ORDER 3 | em Next_order Next_order 
a data same day |CUSTOMERA 


ORDER 2 ORDER | Next_ | Next_order 
| data day 加 CUSTOMER A 


ORDER X ORDER | Next_order Next_order 
CUSTOMER T| data | C CUSTOMERT 


ORDERY ORDER | Next_order Next_order 
CUSTOMER M| data dayC CUSTOMER M 


图 C-7 多 表 结构 的 例子 


多 表 提供 了 和 多 索引 相同 的 一 些 好 处 ( 见 第 6 章 有 关 主 键 索引 和 辅 键 索引 的 讨论 ) 。 多 表 的 
主要 缺点 以 及 它 投 有 在 关系 DBMS 中 使 用 的 主要 原因 是 扫描 表 的 代价 要 比 访问 索引 的 代价 高 ， 
开 且 尚 无 快速 方式 响应 多 表 的 多 键 限定 (例如 要 找 Northwest 区 域 的 所 有 顾客 记录 以 及 Paper 产 
二 系 列 中 的 所 有 产品 )。 由 于 这 一 点 和 其 他 理由 ， 在 现代 数据 库 技术 中 ， 索 引 一 般 奉 代 了 线性 
数据 结构 。 但 是 ， 一 些 遗 留 应 用 可 能 仍然 在 使 用 单 表 或 多 表 结 构 的 技术 。 


C.4 链 结构 的 危险 性 
除了 禁止 链 在 快速 响应 多 键 限 定 中 使 用 这 个 局 限 性 外 ， 链 还 有 下 面 的 危险 和 限制 : 
1) 由 于 顺序 存储 的 记录 未 必 在 物理 上 相 邻 存储 ， 因 此 扫描 一 条 链 将 花费 很 长 的 时 间 。 
2) 链 很 容易 被 破坏 。 如 果 在 链 维护 例 程 中 间 发 生 了 异常 事件 ， 那 么 链 可 能 被 部 分 更 新 而 链 


将 变 得 不 完整 或 不 准确 。 某 些 安全 性 机 制 能 处 理 这 样 的 错误 ， 但 这 些 机 制 需要 额外 存储 空间 或 
处 理 开 销 。 


C.5 树 
线性 数据 结构 可 能 会 变 得 很 长 ， 因 此 扫描 很 费时 ， 这 是 任何 线性 结构 中 的 固有 问题 。 还 好 ， 
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利用 分 而 治之 策略 的 非 线 性 结构 已 被 开发 出 来 。 树 就 是 一 种 常见 的 非 线 性 结构 。 树 (参见 图 C-8) 
是 一 种 由 一 组 结 点 组 成 的 数据 结构 ， 其 分 支 都 起 源 于 树 的 顶端 结 点 。( 因此 树 是 倒置 的 ! ) 树 的 
顶端 结 点 称 为 根 结 点 。 除 了 根 结 点 外 ， 树 中 每 个 结 点 都 有 一 个 父 结 点 ， 并 且 可 以 有 零 个 、 一 个 
或 多 个 子 结 点 。 结 点 以 层次 方式 定义 : 根 的 层次 为 0， 其 子 结 点 的 层次 为 1， 以 此 类 推 。 

树 中 没有 子 结 点 的 结 点 称 为 叶 结 点 (例如 图 C-8 中 的 结 点 J、F、C、G、K、L 和 1)。 一 个 结 
点 的 子 树 由 这 个 结 点 及 其 所 有 子孙 结 点 组 合 而 成 。 





子 树 


图 C-8 树 数 据 结构 的 例子 
平衡 树 

住 数据 库 管理 系统 中 ， 树 经 常用 于 把 数据 组 织 到 键 索 引 中 。 和 线性 数据 结构 一 样 ， 由 于 这 
个 结构 是 DBMS 软 件 维护 的 ， 因 此 数据 库 程序 员 不 必 维 护 树 结构 。 但 是 ， 数 据 库 设计 者 可 以 控 
制 索 引 树 的 结构 ， 以 便 调整 索引 处 理 的 性 能 。 

用 于 建立 键 索引 的 树 的 最 常用 的 形式 是 平衡 树 ， 即 B 树 。 在 B 树 中 ， 所 有 叶子 与 根 的 距离 
相同 。 因 此 ，B 树 是 真正 有 效 的 。B 树 既 支持 记录 的 随机 检索 ， 也 支持 顺序 检索 。B 树 最 常用 的 
形式 是 B+ 树 。 度 数 为 m 的 B+ 树 有 如 下 特殊 的 平衡 树 性 质 : 

* 每 个 结 点 的 子 结 点 的 数目 在 m/2 和 m 之 间 (m 是 一 个 大 于 等 于 3 的 整数 ， 通 常 是 奇数 )， 而 

根 结 点 不 受 这 个 下 界 的 约束 。 

这 个 性 质 将 导致 结 点 的 动态 组 织 ， 这 个 性 质 在 本 节 后 面 将 加 以 说 明 。 

许多 操作 系统 支持 的 数据 访问 方法 VSAM (虚拟 顺序 访问 方法 ) 是 基于 B 树 数据 结构 的 。 
VSAM 是 ISAM (索引 顺序 存 取 方法 ) 的 比较 现代 的 版 本 。ISAM 和 VSAM 之 间 有 两 个 主要 的 区 
别 : 1) ISAM 中 索引 项 的 位 置 受 磁盘 驱动 器 的 物理 边界 的 限制 ， 而 VSAM 中 的 索引 项 可 以 跨越 
物理 边界 。2) ISAM 文 件 在 插入 和 删除 许多 键 后 其 文件 结构 会 变 得 低 效 ， 因 而 需要 重建 ， 而 
VSAM 中 的 索引 在 索引 段 变 得 不 易 控 制 时 能 以 增 量 方式 动态 重组 织 。 

B+ 树 (度数 为 3) 的 例子 出 现在 图 C-9 松 谷 家 具 公 司 的 Product 文 件 中 。 在 这 个 图 中 ， 每 个 
重 直 箭头 表示 值 等 于 箭头 左边 的 数值 但 小 于 箭头 右边 的 数值 这 样 一 条 路 经 。 例 如 ， 在 包含 值 
625 和 1000 的 非 叶 结 点 中 ， 从 这 个 结 点 底部 的 中 间 引 出 的 箭头 是 值 等 于 625 但 小 于 1000 的 一 条 路 
径 。 水 平 箭头 用 于 连接 叶 结 点 ， 以 便 不 必 在 树 的 层次 上 移动 就 能 进行 顺序 处 理 。 











@ 
日 


图 C-9 B+ 树 的 例子 


假设 需 检 索 产 品 编号 为 1425 的 数据 记录 。 注 意 ， 根 结 点 的 值 为 1250。 由 于 1425 大 于 1250， 
因此 沿 着 这 个 结 点 右边 的 箭头 到 达 下 一 层次 。 在 找到 的 目标 值 (1425) 的 结 点 中 ， 再 沿 着 中 间 
箭头 往 下 到 达 包 含 值 为 1425 的 叶子 结 点 。 这 个 结 点 包含 一 个 指针 ， 指 向 产品 编号 为 1425 的 数据 
记录 ， 因 此 现在 能 检索 到 这 个 记录 。 你 也 可 以 沿 着 类 似 的 路 径 找 到 产品 编号 为 1000 的 记录 。 由 
于 数据 记录 存储 在 索引 之 外 ， 因 此 在 同样 数据 上 可 以 维护 多 个 B+ 树 索引 。 

利用 B+ 树 还 能 支持 记录 的 插入 和 删除 。 对 B+ 树 结构 的 改变 都 是 动态 的 ， 并 仍 保留 B+ 树 的 
性 质 。 考 虑 插入 键 值 为 1800 的 记录 到 图 C-9 的 B+ 树 中 。 插 入 的 结果 如 图 C-10a 所 示 。 由 于 结 点 1 
现在 考虑 桂 入 另 一 个 记录 的 效果 。 这 次 将 1700 插 入 到 图 C-10a 的 B+ 树 中 。 这 个 插入 的 初始 结果 
显示 在 图 C-10b 中 。 此 时 ， 结 点 1 违反 了 度数 的 限制 ， 因 此 这 个 结 点 必须 分 裂 成 两 个 结 点 。 分 裂 
结 点 ! 将 会 在 结 点 2 产生 新 的 项 ， 这 样 这 个 结 点 会 有 四 个 子 结 点 ， 多 了 一 个 。 因 此 ， 结 点 2 必须 
也 分 裂 ， 并 加 一 个 新 的 项 到 结 点 3。 最 后 的 结果 如 图 C-10c 所 示 。 
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al 插入 记录 1800 
图 C-10 在 B+ 树 中 插入 记录 
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日 
可 
| 
Tal 四 局 | 


| 全 | 


b) 开始 试图 插入 记录 1700 


eset tert 


c) 插入 记录 1700 后 的 最 终 的 B+ 树 
图 C-10 ( 续 ) 


在 根 变 得 太 大 (大 于 m 个 子女 ) 时 ， 也 会 发 生 有 趣 的 事情 。 在 这 种 情况 下 ， 根 要 分 裂 ， 树 
要 增加 一 个 层次 。 删 除 记录 会 删除 叶 结 点 中 的 一 个 项 。 如 果 这 个 删除 使 叶 结 点 的 子女 少 于 m/2 
个 ， 那 么 叶 结 点 就 要 与 邻近 的 叶 结 点 合并 ; 如 果 合并 后 的 叶 结 点 太 大 (多 于 m 个 子女 )， 那 么 
合并 的 叶 结 点 就 要 分 裂 ， 直 接 导 致 键 在 结 点 之 间作 一 些 倾斜 的 重新 分 布 ， 结 果 使 B+ 树 重新 动 
态 地 组 织 ， 从 而 使 树 保持 平衡 ( 从 根 引 出 的 任何 路 径 深度 相等 )， 并 且 每 个 结 点 的 项 都 在 限定 
范围 内 (这样 控 制 了 树 的 茂盛 底 ， 即 宽度 ) 。 

如 果 要 学 习 关 于 B 树 更 多 的 内 容 ， 请 阅读 Comer ( 1979) 有 关 B 树 性 质 和 设计 的 一 篇 经 典 文 
C.6 参考 文献 
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附录 D 对 象 -关系 数据 库 


本 书 描述 了 设计 和 实现 数据 库 时 使 用 最 广泛 的 两 种 模型 .关系 型 和 面向 对 象 型 。 关 系 模型 
(与 关系 数据 库 管 理 系统 ) 是 目前 最 常 使 用 的 实现 主流 业务 应 用 的 模型。 这 个 模型 的 优势 包括 : 

“数据 独立 性 ， 已 在 第 1 章 介绍 过 。 

* 功能 强大 的 查询 语言 (SQL)， 已 在 第 7 章 介绍 过 

“成 熟 的 关系 数据 库 管理 系统 技术 ， 包 含 在 线 备份 和 恢复 、 灵 活 的 并 发 控制 等 特性 〈 已 在 

第 12 章 介绍 过 )。 

尽管 有 这 些 优势 ， 但 我 们 在 第 14 章 〈 以 及 其 他 章 中 ) 已 提 到 ， 关 系数 据 模型 不 适合 处 理 复 
杂 数 据 类 型 ， 例 如 图 像 、 音 频 、 视 频 和 空间 (或 地 理 ) 数据 。 因 此 ， 引 入 了 面向 对 象 数据 模型 
来 管理 这 些 复杂 的 数据 类 型 (这 种 模型 已 在 第 14、15 章 介绍 过 )。 面 向 对 象 数据 库 管 理 系统 的 
市 场 增长 较 慢 ， 但 是 这 种 技术 在 集成 了 多 媒体 数据 类 型 的 Web 服 务 器 这 样 的 应 用 方面 有 着 非常 
好 的 前 景 。 面 向 对 象 数据 库 系 统 的 弱点 (至少 到 上 日前) 是 不 具备 关系 系统 所 具有 的 查询 功能 、 
在 线 备份 和 恢复 、 灵 活 的 并 发 控制 等 重要 特性 。 

总 之 ， 关 系 和 面向 对 象 数据 库 系统 各 有 特色 和 弱点 。 一 般 来 说 ， 一 种 系统 的 弱点 通常 是 另 
一 种 系统 的 特色 (反之 亦 然 )。 这 就 导致 : 
企图 把 这 两 种 模型 的 优点 结合 起 来 《Stonebraker 等 ，1990)。 大 多 数 主流 的 DBMS 供 应 商都 开 
发 了 对 象 -~ 关系 数据 库 系统 。 这 些 系统 能 处 理 对 象 和 规则 、 封 装 、 多 态 和 继承 ， 它 们 与 
RDBMS 是 相 容 的 。 本 附录 将 对 这 种 系统 作 简短 的 介绍 ， 包 括 它 的 优点 和 缺点 。 


D.1 基本 概念 和 定义 


对 象 - 关 系数 据 库 管 理 系 统 (Object-Relational Database Management System, ORDBMS) 
是 以 集成 的 方式 支持 关系 型 和 面向 对 象 特色 的 数据 库 引 擎 (Frank，1995)。 这 样 ， 用 户 在 使 用 
公共 接口 (例如 SQL) 时 能 定义 、 操 纵 、 查 询 关 系数 据 和 对 象 。DBMS 的 基本 数据 模型 是 关系 
型 。 这 样 ， 尽 管 数据 库 以 面向 对 象形 式 出 现在 程序 员 面 前 ， 但 存储 和 处 理 仍 是 关系 型 的 ;因此 
在 关系 和 对 象 型 之 间 映 射 需要 花 额 外 的 开销 。 

在 对 象 - 关 系数 据 库 中 还 使 用 两 个 术语 : 扩展 关系 (extended relational) 和 通用 服务 器 
(universal server)。 术 语 扩 展 关系 (比较 旧 的 术语 ) 起 源 于 在 已 有 的 关系 DBMS 中 加 入 面向 对 
象 特性 而 开发 的 第 一 个 版 本 。 术 语 通 用 服务 器 (比较 现代 的 术语 ) 是 基于 用 相同 服务 器 技术 管 
理 任何 类 型 数据 (包含 用 户 定义 的 数据 类 型 ) 的 已 确定 目标 。 

D.1.1 ORDBMS 的 特性 

正如 前 面 的 内 容 所 述 ，ORDBMS 的 作用 是 把 关系 数据 库 模 型 和 对 象 数据 库 模型 的 最 好 特 
性 结合 起 来 。 其 主要 特性 通常 包含 下 面 两 点 : 

1) SQL 的 增强 版 本 (类 似 于 SQL3) 可 用 来 创建 和 操纵 关系 表 和 对 象 类 型 或 类 。 

2) 支持 包含 继承 、 多 态 、 用 户 定义 (或 抽象 ) 数据 类 型 和 导航 式 访问 的 传统 的 面向 对 象 范 
数 。 

D.1.2 复杂 数据 类 型 
在 SQL 中 有 三 种 主要 的 数据 类 型 : NUMERIC、 CHARACTER 和 TEMPORAL。 NUMERIC 
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类 型 包含 DECIMAL 和 INTEGER 两 种 ， 而 TEMPORAL 类 型 包含 DATE 和 TIME 两 种 (Celko， 
1995 ) 。 

现代 业务 应 用 通常 需要 存储 和 操纵 关系 系统 不 易 处 理 的 复杂 数据 类 型 。 这 些 复杂 数据 类 型 
中 比较 常见 的 几 种 在 表 D-1 中 列 出 。 对 于 每 种 数据 类 型 ， 这 个 表 提供 简短 的 描述 和 若干 典型 的 
应 用 。 例 如 ，Graphic 数 据 类 型 由 点 、 线 和 圆 等 几何 对 象 组 成 ; 其 典型 的 应 用 有 计算 机 辅助 设 
计 (CAD)、 计 算 机 辅助 制造 (CAM)、 计 算 机 辅助 软件 工程 (CASE) 工具 和 演示 图 (例如 流 
程 图 和 曲线 图 )。 


表 D-1 复杂 数据 类 型 
数据 类 型 描 述 应 用 实例 
Image 位 映射 表示 文档 、 照 片 、 医 疗 图 像 、 指 纹 
Graphic ” 几何 对 象 CAD、CAM、CASE、 演 示 图 
Spatial 地 理 对 象 ”地 图 
Recursive 储 套 对 象 材料 单 
Audio 声音 剪辑 音乐 、 动 画 、 游 戏 
Video 视频 段 、 电 影 教学 片 、 产 品 演示 、 电 影 
Array 下 标 变量 . 时 序 、 多 维 数组 、 多 值 属 性 
Computational-intensive _ 需要 大 量 计算 的 数据 数据 挖掘 ， 金 融 工 具 (例如 派生 ) 


D.2 增强 的 SQL 


ORDBMS 最 强大 的 特性 是 能 使 用 关系 查询 语言 (如 SQL3) 的 扩充 版 本 来 定义 、 检 索 和 操 
纵 数 据 (Cattell，1994; Chaudhri 和 Zicari，2001 )。 . 
D.2.1 简单 的 例子 

假设 一 个 组 织 想 要 创建 一 个 名 为 EMPLOYEE 的 关系 来 记录 员工 数据 (参见 图 D-1)。 表 中 
传统 的 关系 属性 是 Emp_ID、Name、Address 和 Date_of_Birth。 此 外 ， 组 织 想 要 存储 每 个 员工 的 
照片 以 便 确定 员工 身份 。 这 个 属性 (其 类 型 由 一 个 对 象 定义 ) 在 图 D-1 中 命名 为 Emp_Photo。 
在 检索 一 个 员工 的 数据 时 ， 员 工 照 片 将 与 其 他 数据 一 起 显示 。 


Charles | 112 Main | 04/27/1973 
34567 Angela 840 Oak 08/12/1967 一 
56789 | Thomas | 520EIm’ | 10/13/1975 加 


图 D-1 带 复 杂 对 象 的 关系 
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SQL3 提 供 的 语句 既 能 创建 表 也 能 创建 数据 类 型 ( 即 对 象 类 )。 例 如 ， 为 EMPLOYEE 所 用 
的 SQL CREATE TABLE 语 名 如 下 所 示 : 
CREATE TABLE EMPLOYEE 
Emp_ID INTEGER NOT NULL, 
Name CHAR(20) NOT NULL, 
Address CHAR(20), 
Date of Birth DATE NOT NULL, 
Emp_Photo IMAGE); 


例 中 的 IMAGE 是 数据 类 型 ( 即 类 )，Emp_Photo 是 类 中 的 一 个 对 象 。IMAGE 可 以 是 预定 义 
的 类 ， 也 可 以 是 用 户 定义 的 类 。 如 果 是 用 户 定义 的 类 ， 那 么 就 要 用 SQL CREATE CLASS 语句 
来 定义 这 个 类 。 用 户 还 可 以 定义 在 类 中 定义 的 数据 上 对 数据 操作 的 方法 。 例 如 ，IMAGE 上 的 
一 个 方法 是 Scale ( )、 用 来 放大 或 缩小 照片 的 尺寸 。 方 法 是 用 Java、C++ 或 Smalltatk 来 编写 的 ， 
并 55IMAGE CALSS 封 装 在 一 起 。 方 法 还 可 以 像 属 性 一 样 ， 在 查询 的 SELECT 表 中 使 用 。 

D.2.2 内 容 寻 址 

关系 SQL 语 言 功能 最 蝇 大 的 一 个 特性 是 能 在 表 中 选择 满足 限定 条 件 的 记录 子 集 。 例 如 ， 在 
EMPPLOYEE 关 系 中 一 个 简单 的 SQL 语句 用 来 选择 所 有 生日 在 12/31/1940 或 之 前 的 员工 的 记录 
( 见 第 7 章 )。 相 比 之 下 ,“ 纯 ”对 象 数据 库 系统 不 具有 这 种 查询 能 力 。 相 反 ， 访 问 对 象 是 导航 式 
的 ， 即 每 个 对 象 都 有 一 个 惟 … 的 对 象 标 识 符 (参见 第 14 章 )。 

ORDBMS 产 品 扩展 关系 内 容 寻 址 能 力 来 查找 复杂 对 象 。( Norman 和 Bloor，1996 )。 内 容 寻 
址 (content addressing) 是 -种 允许 用 户 查 询 数据 库 以 选择 满足 一 个 限定 条 件 的 所 有 记录 或 对 
象 的 机 制 。 

SQL3 包 含 对 复杂 数据 类 型 的 内 容 寻 址 的 扩展 能 力 。 先 来 看 在 EMPLOYEE 表 中 怎样 应 用 内 
容 寻 址 。 应 记 住 ， 每 个 员工 记录 都 包含 (或 至 少 链接 到 ) 该 员工 的 一 张 照 片 。 用 户 可 能 要 提出 
下 列 查询 : 给 定 一 个 人 的 照片 ， 通 过 扫描 EMPLOYEE 表 来 决定 是 否 存在 与 这 张 照片 高 度 匹 配 
的 员工 ， 然 后 显示 选中 的 员工 或 若干 员工 的 数据 (包含 照片 )。 假 定 照片 的 电子 图 像 存储 在 名 
为 My_Photo 的 位 置 。 那 么 这 种 情况 的 查询 可 写成 下 列 形式 : 

SELECT * 

FROM EMPLOYEE 
WHERE My _ Photo LIKE Emp_Photo; 


ORDBMS 的 内 容 寻 址 是 允许 用 户 搜索 与 图 像 、 音 频 或 声 频 节 段 、 文 档 等 多 媒体 对 象 匹配 
的 数据 的 -种 功能 强大 的 特性 。 这 个 特性 的 -个 常见 的 应 用 就 是 搜索 数据 库 ， 查 找 与 指纹 或 声 
音 匹 配 的 项 目 。 


D.3 对 象 -关系 方法 的 优点 


对 于 需要 在 大 数据 集 上 进行 复杂 处 理 或 重要 的 查询 活动 的 应 用 而 言 ， 与 关系 数据 库 系 统 相 
比 ， 对 象 - 关 系 方法 具有 下 列 优点 (Moxon，1997): 

1) 减少 了 网 络 传输 。 使 用 方法 来 扫描 数据 的 查询 可 以 完全 在 服务 器 上 执行 ， 不 必 发 送 大 量 
数据 返回 到 客户 机 。 

2) 应 用 和 查询 性 能 。 处 理 大 型 数据 集 的 方法 能 充分 利用 大 型 并 行 服务 器 来 很 好 地 改善 性 


bb 
He。 


3) 软件 维护 。 数 据 与 方法 一 起 存储 在 服务 器 上 极 大 地 简化 了 软件 维护 的 工作 。 
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4) 集中 式 数据 和 事务 管理 。 所 有 事务 的 完整 性 、 并 发 性 、 备 份 和 恢复 都 在 数据 库 引 擎 中 处 
理 。 


D.4 ORDBMS 供 应 商 和 产品 


主要 的 供应 商 和 他 们 提供 的 ORDBMS 产 品 见 表 D-2。 表 中 还 显示 了 每 一 个 供应 商 允 许 用 户 
定义 自己 的 数据 类 型 以 及 操纵 数据 的 方法 的 扩展 技术 (或 框架 )。 
表 D-2 ORDBMS 供 应 商 和 产品 





供应 商 产 蝇 Extender 技 术 站 点 
IBM DB2 Universal Database DB2 Extenders www_4.ibm.com/software/data/db2/udb/ 
" Informix Dynamic Server Data Blades www.informix.com/informix/products/ integration/ 
datablade/ datablade_ds.htm 
Oracle Oracle 8 Data Cartridges www.oracle.com/oramag/webcolums/ora8804.html 
Computer Associates ODB-H (Jasmine) none www.cai.com/products/jasmine htm 
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D.6 ”Web 资源 


参见 表 D-2。 

* www.object-relational.com Barry&Associates 公 司 的 网 站 ， 包 括 许 多 对 象 - 关 系数 据 库 管 
理 系统 特性 的 比较 。 

* http://technet.oracle.com/products/oracle8/info/objwp3/x003twp.htm， 该 文章 是 对 Oracle8 的 
对 象 -关系 数据 库 特性 的 综述 。 





ACM 
AITP 
ANSI 
API 
ASCII 
ASP 
BCNF 
BOM 
B2B 
B2C 
CAD/CAM 


CASE 
CD-ROM 
CFML 
CGI 
COM 
CPU 
CRM 
CRT 
Ci/S 
CSF 
CSS 
DA 
DBA 
DBD 
DBMS 
DB2 
DCL 
DDL 
DFD 
DK/NF 
DML 
DNS 
DSS 
EDI 


术语 缩写 


Association for Computing Machinery (美国 计算 机 协会 ) 

Association of Information Technology Professionals (信息 技术 专业 学 会 
American National Standards Institute (美国 国家 标准 学 会 ) 

Application Program Interface (应 用 程序 接口 ) 

American Standards Code for Information Interchange (美国 信息 交换 标准 码 ) 
Active Server Pages (活动 服务 器 页 面 ) 

Boyce-Codd Normal Form (Boyce-Codd 范 式 ) 

Bill of Materials (材料 单 ) 

Business-to-Business (企业 对 企业 ) 

Business-to-Consumer (企业 对 消费 者 ) 

Computer-Aided Design/Computer-Aided Manufacturing (计算 机 辅助 设计 /计算 机 
辅助 制造 ) 

Computer-Aided Software Engineering (计算 机 辅助 软件 工程 ) 

Compact Disk-Read-Only Memory (光盘 只 读 存储 器 ) 

ColdFusion Markup Language (ColdFusion 标 记 语 言 ) 

Common Gateway Interface (公共 网 关 接口 ) 

Component Object Model (组 件 对 象 模型 ) 

Central Processor Unit (中 央 处 理 单元 ) 

Customer Relationship Management (客户 关系 管理 ) 

Cathode Ray Tube (阴极 射线 管 ) 

Client/Server (客户 /服务 器 ) 

Critical Success Factor (关键 成 功 因素 ) 

Cascading Style Sheets ( 层 公 样式 表 ) 

Data Administrator (或 Data Administration) (数据 管理 员 或 数据 管理 ) 
Database Administrator (或 Database Administration) (数据 库 管 理 员 或 数据 库 管 理 ) 
Database Description (数据 库 描述 ) 

Database Management System (数据 管理 系统 ) 

Data Base2 (一 种 IBM 关 系 型 DBMS) 

Data Control Language (数据 控制 语言 ) 

Data Definition Language (数据 定义 语言 ) 

Data Flow Diagram (数据 流 图 ) 

Domain-Key Normal Form ( 域 - 键 范式 ) 

Data Manipulation Language (数据 操纵 语言 

Domain Name Server (域名 服务 器 ) 

Decision Support System (决策 支持 系统 ) 

Electronic Data Interchange (电子 数据 交换 ) 
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MOLAP 
MPP 
MVCH 
NUPI 
NUSI 
ODBC 
ODBMS 
ODL 
ODS 


Enterprise Data Warehouse (企业 数据 仓库 ) 

Extended Entity-Relationship (扩展 实体 -联系 ) 
Entity-Relationship ( 实体 -联系 ) 

Entity-Relationship Diagram (实体 -联系 图 ) 

Enterprise Resource Planning ( 企业 资源 规划 ) 
Extract-Transform-Load (抽取 -转换 -装载 ) 

Foreign Key (外 键 ) 

Graphical User Interface (图 形 用 户 界 面 ) 

Hypertext Markup Language ( 超 文 本 标记 语言 ) 

Hypertext Transfer Protocol ( 超 文 本 传输 协议 ) 

International Business Machines (国际 商用 机 器 公司 ，IBM 公 司 ) 
Integrated Computer-Aided Software Engineering (集成 计算 机 辅助 软件 工程 ) 
Identifier (标识 符 ) 

Intrusion Detection System (非法 入 侵 检 测 系 统 ) 
Input/Output (输入 /输出 ) 

information Repository Dictionary System (信息 库 词典 系统 ) 
Information Resource Management (信息 资源 管理 ) 
Information System (信息 系统 ) 

Information Systems Architecture (信息 系统 体系 结构 ) 
Indexed Sequential Access Method (索引 顺序 存 取 方法 ) 
International Standards Organization (国际 标准 化 组 织 ) 
Information Technology (信息 技术 ) 

Information Technology Association of America (美国 信息 技术 协会 ) 
Java Database Connectivity (Java 数 据 库 连 接 ) 

Java Server Pages _ (Java 服务器 页 面 ) 

Local Area Network (局域网 ) 

Logical Database ( 逻辑 数据 库 ) 

Logical Database Record (逻辑 数据 库 记 录 ) 

Million Bytes ( 兆 字 节 ) 

Management Information System (管理 信息 系统 ) 
Many-to-Many (多 对 多 ) 

Many-to-One (多 对 一 ) 

Multidimensional On-line Analytical Processing ( 多维 联机 分 析 处 理 ) 
Massively Parallel Processing (大 规模 并 行 处 理 ) 

Mountain View Community Hospital ( 山 景 社区 医院 ) 
Nonunique Primary Index ( 非 惟一 主 索 引 ) 

Nonunique Secondary Index ( 非 惟 一 辅 索 引 ) 

Open Database Connectivity (开放 数据 库 连 接 ) 

Object Database Management System (对 象 数据 库 管理 系统 ) 
Object Definition Language (对 象 定义 语言 

Operational Data Store (运作 型 数据 存储 ) 
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OLAP On-line Analytical Processing (联机 分 析 处 理 ) 
OLE Object Linking and Embedding ( 对象 链接 和 贬 入 ) 
OLTP On-line Transaction Processing (联机 事务 处 理 ) 
OO Object-Oriented (面向 对 象 ) 

OODM Object-Oriented Data Model (面向 对 象 数据 模型 ) 
OQL Object Query Language ( 对象 查询 语言 ) 

O/R Object/Relational (对 象 /关系 ) 


ORDBMS ”Object-Relational Database Management System (对 象 - 关 系数 据 库 管 理 系 统 ) 
OSAM Overflow Sequential Access Method (溢出 顺序 存 取 法 ) 


PC Personal Computer (个 人 计算 机 ) 

PK Primary Key (主键 ) 

PVF Pine Valley Furniture ( 松 谷 家 具 公 司 ) 

QBE Query-by-Example ( 按 例 查询 ) 

RAID Redundant Array of Inexpensive Disks (廉价 元 余 磁 盘 阵 列 ) 


RDBMS Relational Database Management System (关系 数据 库 管理 系统 ) 
ROLAP Relational On-line Analytical Processing (关系 联机 分 析 处 理 ) 


SDLC Systems Development Life Cycle (系统 开发 生命 周期 ) 
SGML Standard Generalized Markup Language (标准 通用 标记 语言 ) 
SMP Symmetric Multiprocessing (对 称 多 处 理 ) 

SQL Structured Query Language (结构 化 查询 语言 ) 


SQL/DS Structured Query Language/Data System (an IBM relational DBMS) (结构 化 查询 语 
言 /数据 系统 ， 一 种 IBM 关 系数 据 库 ) 


SSL Secure Sockets Layer (安全套 接 层 ) 

TCP/IP Transmission Control Protocol/Internet Protocol (传输 控制 协议 /网 间 协 议 ) 
TQM Total Quality Management (全 面 质量 管理 ) 

UDF User-Defined Function 《用 户 定义 国 数 ) 

UDT User-Defined Datatype (用 户 定义 数据 类 型 ) 

UML Unified Modeling Language (统一 建 模 语言 ) 

UPI Unique Primary Index (惟一 主键 索引 ) 

URL Uniform Resource Locator (统一 资源 定位 器 ) 

USI Unique Secondary Index (惟一 辅 索 引 ) 

VBA Visual Basic for Applications (编写 应 用 程序 用 的 VB 语言 ) 
VLDB Very Large Database ( 大 规模 数据 库 ) 

W3C World Wide Web Consortium ( 万维网 联盟 ) 


WWW World Wide Web (万维网 ) 
XHTML Extensible Hypertext Markup Language (可 扩展 超 文 本 标记 语言 ) 


XML Extensible Markup Language (可 扩展 标记 语言 ) 
XSL Extensible Style Language (可 扩展 样式 语言 ) 

1:1 One-to-One (一 对 一 ) 

1:M One-to-Many (一 对 多 ) 


1NF First Normal Form (第 一 范式 ) 








2NF 
3NF 
4NF 
SNF 


Second Normal Form (第 二 范式 ) 
Third Normal Form (第 三 范式 ) 
Fourth Normal Form (第 四 范式 ) 
Fifth Normal Form (第 五 范式 ) 


术语 缩写 


人 553 








术 语 表 


注意 : 在 后 面 的 括号 中 列 出 的 是 定义 术语 的 章 或 附录 。 

中 止 事务 (Aborted transaction): 在 进行 过 程 中 异常 中 断 的 事务 。( 12 ) 

抽象 类 (Abstract class): 没有 直接 实例 的 类 ， 但 它 的 子孙 可 以 有 直接 实例 。( 14) 

抽象 操作 (Abstract operation) : 定义 操作 的 形式 或 协议 ， 但 没有 定义 实现 的 一 种 操作 。 
(14) 

动作 (Action): 可 以 在 数据 对 象 上 执行 的 操作 ， 如 创建 、 删 除 、 更 新 、 或 读 取 。(4) 

动作 断言 (Action assertion) : 对 组 织 动 作 进 行 约束 或 控制 的 语句 。(4) 

主动 数据 仓库 (Active data warehouse): 一 种 企业 数据 仓库 ， 可 以 接近 实时 地 从 记录 系 
统 中 接受 事务 数据 的 输入 ， 并 立即 将 合适 的 数据 转换 并 载 入 数据 仓库 ， 为 事务 处 理 系统 提供 对 
企业 数据 仓库 接近 实时 的 访问 。( 11) 

ActiveX: 由 微软 开发 的 一 组 松散 定义 的 技术 ， 它 扩展 了 浏览 器 功能 并 允许 操纵 浏览 器 的 
内 部 数据 。( 10 ) 

后 象 (AfterImage): 记录 (或 者 内 存 页 ) 在 修改 后 得 到 的 一 个 拷贝 。( 12) 

合 (Aggregation): 把 数据 从 细节 级 转换 到 汇总 级 的 过 程 (11)。 组 件 对 象 和 聚合 对 象 

之 间 的 PART-OF 联 系 。 (14) 

别名 (Alias): 属性 的 一 个 可 选 的 名 字 。(5) 

锚 点 对 象 (Anchor object) : 关于 限制 某 些 动作 的 业务 规则 (事实 )。(4) 

异常 (Anomaly): 当 用 户 试图 更 新 含有 宛 余数 据 的 表 时 ， 可 能 发 生 的 错误 和 不 一 致 性 。 
三 种 异常 类 型 是 插入 、 删 除 和 修改 。(5) 

应 用 分 割 (Application partitioning): 在 编写 完毕 后 ， 将 各 部 分 的 应 用 程序 代码 分 派 给 不 
辣 的 客户 端 或 服务 器 分 区 的 过 程 ， 以 获得 更 好 的 性 能 和 互 操作 性 ( 即 一 个 组 件 在 不 同 平台 上 执 
行 的 能 力 )。(9) 

应 用 程序 接口 (Application Program interface ，API) : 计算 机 操作 系统 向 应 用 程序 提供 
的 例 程 集合 。(9) 

数组 (Array): 能 用 位 置 定位 的 元 素 的 有 序 集合 ， 其 大 小 可 以 动态 变化 。( 15 ) 

关联 (Association): 两 个 或 多 个 对 象 类 之 间 已 命名 的 联系 。 (14) 

关联 类 (Association class): 自身 具有 属性 或 操作 的 关联 ， 或 者 参与 其 他 类 的 关系 的 关 
联 。(14) 

关联 角色 (Association role)- 关联 中 与 类 连接 的 那 一 端 。( 14) 

关联 实体 (Associative entity) : 一 种 实体 类 型 ， 关联 一 个 或 多 个 实体 类 型 实例 ， 并 拥有 
专属 于 那些 实体 类 型 之 间 的 联系 自身 的 属性 (3) 

异步 分 布 式 数据 库 (Asynchronous distributed database): 分 布 式 数 据 库 技术 的 一 种 形 
式 ， 其 中 复制 数据 的 拷贝 保存 在 另外 的 结 点 上 ， 这样 ， 本 地 服务 器 不 通过 网 络 就 能 够 访问 数据 。 
(13) 

原子 文字 (Atomic literal) : 不 能 再 进一步 分 解 为 其 他 组 件 的 常数 。( 15 ) 

属性 (Attribute); 组 织 所 关心 的 实体 类 型 的 性 质 或 特征 。(3) 
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属性 继承 (Attribute inheritance): 子 类 型 实体 继承 超 类 型 所 有 属性 值 的 一 种 性 质 。(4) 

授权 规则 (Authorization rule): 集成 在 数据 库 管理 系统 中 ， 限 制 对 数据 的 访问 ， 并 限制 
人 们 在 访问 数据 时 所 能 采取 的 动作 的 各 种 控制 法 则 。(12) 

备份 工具 (Backup facility): 产生 整个 数据 库 备 份 拷贝 (保留 本 ) 的 一 种 自动 转 储 工具 。 
(12) 

后 向 恢复 ( 回 滚 ) (Backward recovery (rollback)): 退出 或 者 撤销 不 想 要 的 数据 库 变 更 ， 
即 把 被 变更 的 记录 的 前 象 应 用 于 数据 库 ， 并 使 数据 库 回归 到 原先 的 状态 。 常 用 于 逆转 由 中 止 或 
异常 中 断 的 事务 所 作出 的 变更 。( 12 ) 

包 (Bag): 包含 重复 元 素 的 无 序 集 合 。( 15 ) 

基 表 (Base table): 关系 数据 模型 中 的 一 种 表 ， 包 含有 插入 的 原始 数据 ， 大 表 对 应 于 数 
据 库 概 念 模式 中 确定 的 关系 。(7) 

前 象 (Before-image): 记录 (或 者 内 存 页 ) 在 修改 前 的 一 个 找 贝 。( 12) 

行为 (Behavior): 表示 对 象 如 何 动作 和 反应 的 。( 14) 

二 元 联系 (Binary relationship): 两 个 实体 类 型 的 实例 之 间 的 联系 。(3) 

生物 设备 (Biometric device): 度量 或 者 检测 个 人 特征 (如 指纹 、 声 纹 、 眼 球 图 或 者 签名 
动力 学 等 ) 的 技术 。( 12) 

位 图 索引 (Bitmap index) : 一 个 位 表 ， 它 的 每 一 行 代表 键 的 一 个 不 同 取 值 ， 而 每 一 列 是 
一 位 。 当 该 位 为 ] 时 ， 则 表明 这 一 列 位 置 上 的 记录 包含 有 相应 的 字段 值 。(6) 

块 因子 (Blocking factor) : 一 页 中 物理 记录 的 数目 。(6) 

Boyce-Codd 范 式 (Boyce-Codd Normal Form, BCNF): 关系 中 每 个 决定 因子 都 是 一 个 
候选 键 。(B) 

浏览 器 (Browser) : 一 种 软件 ， 它 能 显示 HTML 文 档 并 且 允 许 用 户 访问 与 HTMIL 文 档 相 关 
的 文件 和 软件 。 浏 览 器 基于 超 链 接 的 使 用 ， 通 过 点 击 某 个 对 象 ， 超 链接 允许 用 户 从 一 个 文档 跳 
到 舅 一 个 文档 。 大 多 数 浏 览 器 支持 用 户 下 载 和 传输 文件 、 访 问 新 闻 组 、 播放 音频 和 视频 文件 、 
执行 由 代码 编写 的 小 模块 (如 Java applets 或 ActiveX 控 件 )。(10) 

业务 功能 (Business function): 支持 企业 某 方面 任务 的 一 组 相关 业务 流程 。(2) 

业务 规则 (Business rule): 定义 或 约束 业务 中 有 关 方 面 的 语句 ， 目的 在 于 声明 业务 的 结 
构 以 及 控制 或 影响 业务 的 行为 。(3) 

企业 对 企业 (B2B，Business to Business): 用 来 描述 与 包括 供应 商 和 厂 商 在 内 的 其 他 企 
业 之 间 进 行 电 子 业务 的 术语 。(10) 

企业 对 客户 (B2C，Business to Consumer) : 用 来 描述 对 消费 者 进行 零售 业务 的 电子 业 
务 术 语 。(10) 

候选 键 (Candidate key): 惟一 标识 关系 中 某 行 的 属性 或 属性 集 。(5) 

基数 约束 (Cardinality constraint): 与 某 实体 的 每 一 个 实例 相 联 系 的 另 一 个 实体 实例 的 个 
数 。(3) 

层 倒 样式 表 (Cascading Style Sheet，CSS): 由 W3C 开 发 的 样式 表 ， 定义 不 同 元 素 的 外 
观 并 可 应 用 到 任何 Web 页 面 上 。 之 所 以 称 之 为 层 登 样式 表 ， 是 因为 可 以 将 多 个 样式 表 应 用 到 同 
一 Web 页 面 上 。(10) 

目录 (Catalog): 一 系列 放 到 一 起 可 以 构成 对 数据 库 的 描述 的 模式 。(7) 

检查 点 工具 (Checkpoint facility): DBMS 用 来 周期 性 地 停 止 接收 任何 新 事务 的 一 种 工具 ， 
此 时 ， 系 统 应 处 于 静止 状态 ， 数 据 库 和 事务 日 志 应 是 同步 的 。 (12) 





556 大 语 下 


类 图 (Class diagram): 类 图 显示 面向 对 象 模型 的 静态 结构 : 对 象 类 、 对 象 类 的 内 部 结构 
和 对 象 类 参与 的 联系 。(14) 

类 范围 属性 (Class-scope attribute): 类 范围 属性 是 类 的 一 个 属性 ， 其 值 在 整个 类 中 都 是 
一 样 的 ， 而 不 是 每 个 实例 有 一 个 特定 的 值 。( 14) 

客户 /服务 器 体系 结构 (Client/server architecture): 参见 Client/server system (客户 /服务 
器 系统 )。 

客户 /服务 器 系统 (Client/server system): 提供 请 求 服务 的 客户 和 服务 器 之 间 分 布 式 处 理 
的 网 络 计算 模型 。 在 数据 库 系 统 中 ， 数 据 库 通常 位 于 处 理 DBMS 的 服务 器 上 。 客 户 通常 处 理应 
用 系统 或 从 其 他 包含 应 用 程序 的 服务 器 中 请 求 服务 。( 9 ) 

ColdFusion 标 记 语 言 (ColdFusion Markup Language，CFML) : 用 于 创建 ColdFusion 应 
用 页 面 脚本 的 语言 。 该 语言 以 HTML 为 模板 构成 ， 它 包含 执行 诸如 读 和 更 新 数据 库 表 等 操作 的 
标记 。(10) 

集合 文字 (Collection literal) : 文字 或 对 象 类 型 的 集合 。(15) 

提交 协议 (Commit protocol) : 确保 事务 或 者 成 功 地 完成 或 者 被 中 止 的 一 种 算法 。( 13 ) 

公共 网 关 接 口 (Common Gateway Interface，CG1): 一 种 web 服 务 器 接口 ， 用 于 指定 
Web 服 务 器 与 CGI 程 序 之 间 信 息 的 传递 。( 10 ) 

完备 性 约束 (Completeness constraint) : 一 种 约束 类 型 ， 用 于 解决 如 下 问题 : 超 类 型 的 
实例 是 否 必须 是 至 少 一 个 子 类 型 的 成 员 。(4) 

复合 属性 (Composite attribute) : 可 分 解 为 更 小 组 成 部 分 的 属性 。(3 ) 

复合 标识 符 (Composite identifier) : 由 复合 属性 组 成 的 标识 符 。(3) 

复合 键 (Composite key): 由 多 个 属性 构成 的 主键 。(5) 

复合 (Composition): 属于 一 个 整体 对 象 的 某 个 部 分 对 象 ， 并 与 整体 对 象 共 存 广 。( 14) 

计算 机 辅助 软件 工程 (Computer-Aided Software Engineering，CASE): 为 系统 开发 过 
程 的 某 些 部 分 提供 自动 支持 的 软件 工具 。(2) 

概念 模式 (Conceptual schema): 数据 库 整 体 结构 的 详细 的 、 技 术 性 的 独立 性 规格 说 明 。 
(2) 

具体 类 (Concrete class): 有 直接 实例 的 类 。( 14) 

并 发 性 控制 (Concurrency control); 在 多 用 户 环境 中 ， 管 理 对 数据 库 同时 发 生 的 多 个 操 
作 的 进程 ， 用 以 维护 数据 完整 性 ， 并 使 这 些 操作 彼此 互 不 干扰 。(12) 

并 发 透明 性 (Concurrency transparency): 分 布 式 数据 库 的 一 种 设计 目标 ， 即 虽然 一 个 
分 布 式 系统 运行 许多 事务 ， 但 它 仍然 表现 出 仿佛 任 一 给 定 的 事务 只 是 该 系统 中 的 惟 -- 的 活动 。 
因此 ， 当 并 发 地 处 理 多 个 事务 时 ， 其 结果 必须 与 顺序 处 理 每 个 事务 的 情况 完全 相同 。 (13) 

一 致 性 维度 (Conformed dimension) : 一 个 或 多 个 维度 的 表 与 两 个 或 更 多 的 事实 表 相关 ， 
并 且 对 于 每 个 事实 表 ， 这 些 维 表 具 有 相同 的 业务 含意 和 主键 。( 11 ) 

约束 (Constraint) : 数据 库 用 户 不 能 违背 的 规则 。(1) 

构造 器 操作 (Constructor operation) : 创建 一 个 类 的 新 实例 的 操作 。( 14) 

内 容 寻 址 (Content addressing): 一 种 工具 ， 人 允许 用 户 查 询 数 据 库 ， 以 选择 满足 限定 条 
件 的 所 有 记录 以 及 /或 对 象 。(D) 

Cookie: 通过 Web 服 务 器 在 客户 端 存储 的 数据 块 。 当 用 户 后 来 又 访问 该 站 点 时 ， cookie 的 
内 容 将 送 加 Web 服务器 ， 用 来 验证 用 户 身份 ， 并 且 返回 定制 的 web 页 面 。(10) 

相关 子 查询 (Correlated subquery): 在 SQL 中 ,内 层 查询 的 处 理 依赖 于 外 层 查 询 数据 的 
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子 查询 。(8 ) 

对 应 对 象 (Corresponding object) : 影响 在 另 -- 业 务 规则 之 上 执行 动作 的 能 力 的 业务 规 
则 (事实 )。(4) 

数据 (Data): 在 用 户 环 境 中 有 意义 的 事实 、 文 本 、 图 形 、 图 像 、 音 频 和 视频 段 。(1) 

数据 管理 (Data administration) : 负责 组 织 中 数据 资源 整体 管理 的 一 种 高 级 功能 ， 包 括 
维护 公司 范围 内 的 定义 与 标准 。(12) 

数据 控制 语言 (Data Control Language，DCL): 用 于 控制 数据 库 的 命令 ， 包 括 权限 和 数 
据 提 交 (保存 ) 的 管理 。(7) 

数据 定义 语言 (Data Definition Language，DDL): 用 于 定义 数据 库 的 命令 ， 包 括 创建 、 
修改 和 删除 表 以 及 建立 约束 。(7) , 

数据 词典 (Data dictionary): 关于 数据 库 的 一 个 信息 库 ， 它 记录 了 数据 库 中 的 数据 元 素 。 
(12) 

数据 独立 性 (Data independence): 数据 描述 和 使 用 该 数据 的 应 用 程序 分 离 。(1) 

数据 操纵 语言 (Data Manipulation Language，DML): 用 于 维护 和 查询 数据 库 的 命令 ， 
包括 更 新 、 插 入 、 修 改 和 查询 数据 。(7) 

数据 集 市 (Data mart) : 限定 在 一 定 范围 内 的 数据 仓库 ， 它 的 数据 或 者 从 数据 仓库 中 选择 
和 汇总 而 来 ， 或 者 从 源 数据 系统 中 提取 、 转 换 和 装载 而 来 。( 11) 

数据 挖掘 (Data mining) : 一 种 混合 了 多 种 技术 的 知识 发 现 , 这 些 技术 包括 传统 的 统计 学 、. 
人 工 智 能 和 计算 机 图 形 学 。(11) 

数据 清洗 (Data scrubbing) : 在 数据 转换 和 载 和 数据 仓库 之 前 ， 使 用 模式 识别 和 其 他 人 
工 智能 技术 改善 原始 数据 质量 的 一 种 技术 。(11) 

数据 管家 (Data steward): 负责 确保 组 织 内 的 应 用 软件 真正 支持 该 组 织 企业 目标 的 人 员 。 
(12) 

数据 转换 (Data transformation): 数据 调和 的 组 成 部 分 ， 它 把 源 运作 系统 的 数据 格式 转 
换 为 EDW 的 数据 格式 。( 11 ) 

数据 类 型 (Data type) : 系统 软件 (如 DBMS ) 可 识别 的 用 于 表示 组 织 数据 的 具体 编码 模 
式 。(6) 

数据 可 视 化 (Data visualization ) : 为 了 便于 人 们 分 析 而 用 图 形 和 多 媒体 的 格式 表示 数据 。 
(11) 

数据 仓库 (Data warehouse): 一 种 集成 的 决策 支持 数据 库 ， 其 内 容 从 不 同 的 操作 数据 库 
中 派生 而 来 。( 1) 一 种 面向 主题 的 、 集 成 的 、 随 时 间 变 化 的 、 不 可 更 新 的 数据 集合 ， 用 于 支持 
决策 过 程 的 管理 。( 11) 

数据 库 (Database): 逻辑 相关 数据 的 有 组 织 的 集合 。( 1 ) 

数据 库 管理 (Database administration ) ， 负责 物理 数据 库 设计 和 处 理 诸如 安全 性 强化 、 
数据 库 性 能 、 备 份 与 恢复 等 技术 问题 的 一 种 技术 功能 。( 12) 

数据 库 应 用 (Database application): 一 个 应 用 程序 (或 一 组 相关 程序 )， 它 用 于 代表 数 
据 库 用 户 执 行 一 系列 的 数据 库 活动 (创建 、 读 取 、 更 新 和 删除 )。 (1) 

数据 库 变更 日 志 (Database change log): 被 事务 修改 的 记录 的 前 象 和 后 象 。( 12 ) 

数据 库 崩溃 (Database destruction) ， 指 数据 库 本 身受 损 、 被 毁坏 ， 或 是 无 法 读 取 。( 12) 

数据 库 管 理 系 统 (Database Management System，DBMS)， 用 于 创建 、 维护 并 提供 对 
用 户 数据 库 有 控制 访问 的 软件 应 用 。(1) 
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数据 库 恢复 (Database recovery): 在 数据 库 于 失 或 者 损害 后 ， 迅 速 并 准确 地 复原 数据 库 
的 一 种 机 制 。( 12 ) 

数据 库 安 全 性 (Database security) : 保护 数据 库 免 受 偶然 或 故意 的 丢失 、 破 坏 与 误 用 。 
(12) 

数据 库 服务 器 (Database server): 在 客户 /服务 器 环境 中 负责 数据 库存 储 ， 访问 以 及 处 
理 的 计算 机 。 有 人 也 用 这 个 术语 来 描述 两 层 的 客户 /服务 器 环境 。(9 ) 

DCS-1000 (Carnivore): FBI 开 发 的 设备 ， 可 通过 跟踪 电子 邮件 头 来 监控 电子 邮件 的 传 
输 量 。( 10) 

死 锁 (Deadlock): 当 两 个 或 更 多 事务 都 锁定 了 共同 的 资源 ， 生 彼此 都 在 等 待 对 方 释放 该 
资源 而 形成 的 一 种 全 局 。( 12) 

死 锁 预 防 (Deadlock prevention) : 指 用 户 应 用 程序 必须 在 一 个 事务 的 开始 点 便 锁 定 该 程 
序 所 需要 的 所 有 记录 ， 而 不 是 每 次 仅 锁定 一 个 记录 。( 12) 

死 锁 化 解 (Deadiock resolution): 指 允 许 死 锁 出 现 ， 但 在 DBMS 里 建立 某 些 机 制 ， 以 便 
检测 出 死 锁 并 打破 死 锁 的 一 种 方法 。( 12) 

分 散 型 数据 库 (Decentralized database): 既 没 有 通过 网 络 和 使 数据 如 同 处 于 一 个 逻辑 
数据 库 的 数据 库 软 件 披 此 互 连 ， 而 是 分 散 地 存放 在 多 个 地 点 的 计算 机 内 的 数据 库 。( 13 ) 

度 (Degree): 参与 联系 的 实体 类 型 的 个 数 。(3 ) 

非 规范 化 (Denormalization): 将 规范 化 的 关系 转化 为 非 规 范 化 的 物理 记录 规格 说 明 的 过 
程 。(6 ) 

依赖 数据 集 市 (Dependent data mart) : 从 企业 数据 仓库 和 它 的 调和 数据 中 获取 全 部 数据 
的 数据 集 市 。( 11 ) 

导出 (Derivation): 从 其 他 业务 知识 中 导出 的 语句 。(4) 

导出 属性 (Derived attribute) : 其 值 可 以 从 其 他 相关 属性 值 计 算出 的 属性 。(3) 

导出 数据 (Derived data) : 为 终端 用 户 的 决策 支持 应 用 而 选择 、 格式 化 和 聚合 的 数据 。 
(11) 

导出 事实 (Derived fact) : 使 用 算法 和 推理 从 其 他 业务 规则 中 导出 的 事实 。(4) 

决定 因子 (Determinant) : 函数 依赖 中 箭头 左边 的 属性 。(5) 

词典 〈Dictionary): 由 键 - 值 对 组 成 的 不 带 重 复 的 无 序 序列 。(15) 

不 相交 规则 (Disjoint rule) : 指定 如 果 一 个 实体 实例 ( 超 类 型 的 实体 实例 ) 是 一 个 子 类 型 
的 成 员 ， 则 不 能 同时 是 另 一 个 子 类 型 的 成 员 。(4) 

不 相交 约束 (Disjointness constraint) : 该 约束 解决 这 样 的 问题 ， 是 否 一 个 超 类 型 的 实例 
同时 是 两 个 或 多 个 子 类 型 的 成 员 。(4) 

分 布 式 数据 库 (Distributed database): 物理 上 虽然 存放 在 多 个 地 点 的 计算 机 内 ， 但 通过 
一 条 数据 通信 链 路 连接 起 来 的 逻辑 上 是 单一 的 数据 库 。(13) 

域名 服务 器 平衡 (DNS(domain name serverjbalancing) ， 一 种 负载 平衡 方法 ， 站 点 主机 
名 的 DNS 服务 器 返回 站 点 的 多 个 下地 址 。(10) 

动态 SQL (Dynamic SQL): 使 应 用 程序 在 执行 时 才 生 成 明确 的 SQL 代码 的 方法 ， (8) 

动态 视图 (Dynamic view) : 由 于 用 户 的 请 求 而 动态 创建 的 一 种 虚拟 表 。 动态 视图 不 是 一 
张 临时 表 ， 相 反 ， 它 的 定义 存储 在 系统 目录 中 ， 视图 的 内 容 被 物化 为 使 用 视图 的 一 条 SQL 查询 
的 结果 。 它 与 物化 视图 的 区 别 视 RDBMS 不 同 而 不 同 ， 物化 视图 可 以 存储 在 磁盘 上 ， 在 间隔 内 
或 使 用 时 刷新 。(7) 
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电子 业务 (Electronic business，e-business): 采用 因特网 相关 技术 ， 使 顾客 与 供应 商 
的 关系 更 加 紧密 的 一 种 电子 业务 活动 。( 10 ) 

电子 商务 (Electronic commerce，e-commerce): 基于 因特网 的 业务 事务 ， 包 括 订单 处 
理 和 执行 、 交 互 客户 关系 管理 、 电 子 数据 交换 (EDI) 和 账单 支付 等 活动 。(10) 

柑 入 式 SQL (Embedded SQL): 在 一 个 用 其 他 语言 (如 C 或 Java) 编写 的 程序 中 包含 硬 
编码 的 SQL 语句 的 过 程 。(8) 

封装 (Encapsulation) : 一 种 对 外 隐藏 对 象 的 内 部 实现 细节 的 技术 。(14) 

加 密 (Encryption): 对 数据 进行 编码 或 者 搅乱 ， 使 别人 不 能 读 出 这 些 数 据 。(12) 

增强 型 实体 -联系 模型 (Enhanced entity-relationship(ERR)model) : 使 用 新 的 建 模 概念 
对 原始 的 E-R 模 型 进行 扩充 所 得 到 的 模型 。(4) 

企业 数据 模型 (Enterprise data model) : 显示 组 织 的 高 层 实体 及 实体 问 联 系 的 图 形 化 模 
型 。(1) 

企业 数据 建 模 (Enterprise data modeling): 数据 库 开发 的 第 一 步 ， 它 指定 组 织 数据 库 的 
范围 和 一 般 内 容 。(2) 

企业 数据 仓库 (Enterprise Data Warehouse，EDW): 一 个 集中 的 、 集 成 的 数据 仓库 ， 
它 是 决策 支持 应 用 的 终端 用 户 可 得 到 的 所 有 数据 的 控制 点 和 惟一 来 源 。(11) 

企业 键 (Enterprise key): 值 在 所 有 关系 里 都 惟一 的 主键 。 (5) 

企业 资源 规划 系统 (Enterprise resource planning (ERP) system) :一 个 集成 了 企业 的 所 
有 功能 (例如 ， 制 造 、 销 售 、 财 务 、 营 销 、 库 存 、 会 计 和 和 人力 资 源 ) 的 企业 管理 系统 。ERP 系 
统 是 为 企业 考察 和 管理 其 活动 提供 必要 数据 的 应 用 软件 。(1) 

实体 (Entity): 在 用 户 环境 中 组 织 所 希望 维护 的 数据 ， 如 人 、 地 方 、 对 象 、 事 件 、 概 念 。 

实体 聚 徐 (Entity cluster) : 一 个 或 多 个 实体 类 型 及 其 相关 联系 的 集合 组 成 的 一 个 抽象 的 
实体 类 型 。(4) 

实体 实例 (Entity instance): 实体 类 型 中 的 一 个 特定 记录 。(3) 

实体 完整 性 规则 (Entity integrity rule) : 主键 属性 (或 组 成 主键 的 部 分 属性 ) 不 可 以 为 空 。 
(5) 

实体 类 型 (Entity type): 具有 共同 性 质 和 特征 的 实体 集合 。(3) 

实体 -联系 图 (Entity-relationship (E-R) diagram): 实体 -联系 模型 的 图 形 表示 。(3) 

实体 -联系 模型 (Entity-relationship (E-R) model); 组 织 或 业务 领域 中 数据 的 逻辑 表示 。 
(3) 

等 值 联结 〈Equi-join) : 其 联结 条 件 为 相同 列 (字段 ) 的 值 相 等 。 这 些 相同 的 列 将 (元 佘 
地 ) 出 现在 结果 表 中 。(8) 

事件 (Event) : 由 事务 产生 的 数据 库 动 作 (创建 、 更 新 或 删除 )。(11) 

事件 驱动 (Event-driven) : 非 过 程 程序 设计 方法 ， 在 事件 发 生 时 检测 该 事件 并 做 出 相应 
反应 。(9) 

排他 锁 (也 称 为 X 锁 或 写 锁 ，Exclusive lock (X lock or write iock)) : 在 该 锁 解 开 之 前 防止 
其 他 事务 读 与 更 新 记录 的 一 种 技术 。(12) 

可 扩展 标记 语言 (Extensible Markup Language，XML) : 一 种 基于 SGML 的 脚本 语言 ， 
它 允 许 创建 定制 标记 ， 从 而 使 路 组织 的 数据 传输 和 共享 更 为 容易 。(10) 

区 (Extent) : 磁盘 存储 空间 的 连续 扁 区 。(6 ) 

数据 库 中 类 的 所 有 实例 的 集合 ， 此 时 译 为 外 延 。( 15) 





外 部 网 (Extranet) : 使 用 因特网 协议 使 公司 的 顾客 和 供应 商 对 公司 数据 和 信息 进行 有 限 
的 访 右 。(1) 

事实 (Fact) : 两 个 或 多 个 术语 之 间 的 关联 。(3) 

故障 透明 性 (Failure transparency): 指 分 布 式 数据 库 的 一 个 设计 目标 ， 它 可 以 保证 每 个 
事务 的 所 有 操作 都 被 提交 或 者 都 没有 被 提交 。(13) 

胖 客 户 机 (Fat client): 负责 处 理 表 示 逻 辑 、 广 泛 的 应 用 和 业务 规则 逻辑 以 及 许多 数据 库 
管理 系统 功能 的 客户 端 个 人 电脑 。(9) 

字段 (Field): 可 以 被 系统 软件 识别 的 最 小 的 数据 单元 。(6) 

文件 组 织 (File organization): 在 二 级 存储 设备 上 物理 安排 文件 中 记录 的 技术 。(6 ) 

文件 服务 器 (File server) : 一 种 管理 文件 操作 的 设备 ， 并 由 每 个 连接 到 局 域 网 的 客户 端 
PC 所 共享 。(9) 

防火 墙 (Firewall) : 一 种 限制 从 外 部 访问 公司 数据 的 硬件 /软件 安全 组 件 。(10) 

第 一 范式 (First normal form) : 不 含 多 值 属 性 的 关系 。(5) 

外 键 (Foreign key): 数据 库 关 系 中 的 一 个 属性 ， 它 在 同一 个 数据 库 中 的 另 一 个 关系 中 是 
主键 。(5 ) 

前 向 恢复 /前 滚 (Forward recovery (rollforward)) : 从 当前 数据 库 的 前 一 份 拷贝 重新 开始 
运行 的 一 种 技术 。 就 是 把 此 前 已 获得 正常 结果 的 事务 的 后 象 直接 应 用 于 数据 库 ， 使 得 数据 库 能 
够 立即 迅速 转向 该 事务 处 理 后 的 状态 。( 12) 

第 四 范式 (Fourth normal form): 满足 BCNF， 即 不 含 多 值 依赖 的 关系 。(B) 

函数 (Function) : 一 个 已 存储 的 子 例 程 ， 只 有 一 个 返回 值 和 输入 参数 。(8 ) 

功能 分 解 (Functional decomposition) : 将 系统 描述 逐步 细 分 为 更 详细 描述 的 一 个 迭代 过 
程 ， 其 中 ， 一 个 功能 由 支持 该 功能 的 更 详细 的 功能 来 描述 。( 2) 

函数 依赖 (Functional dependency): 两 个 属性 或 两 个 属性 集 之 间 的 约束 。(5) 

概 化 (Generalization):; 从 一 组 更 特殊 的 实体 定义 更 一 般 实体 类 型 的 过 程 。(4) 

全 局 事务 (Global transaction): 分 布 式 数据 库 中 的 一 种 事务 ， 它 需要 引用 一 个 或 者 多 个 
非 本 地 站 点 上 的 数据 ， 以 满足 其 请 求 。(13) . 

粒度 (Grain): 事实 表 的 详细 级 别 ， 由 组 成 主键 的 所 有 组 件 的 交集 决定 ， 包 括 所 有 外 键 和 
除 此 之 外 的 主键 元 素 。(11) 

散 列 索引 表 (Hash index table): 文件 组 织 的 一 种 形式 ， 使 用 哈 希 方 流 将 键 陕 射 到 索引 表 
中 的 一 个 位 置 ， 在 该 位 置 存 放 指 向 对 应 于 哈 希 键 的 实际 数据 记录 的 指针 。(6) 

散 列 文件 组 织 (Hashed file organization): 一 种 存储 系统 ， 其 中 每 个 记录 的 地 址 是 使 用 
一 个 哈 希 算法 来 决定 的 。(6) 

散 列 算法 (Hashing algorithm) : 一 个 将 主键 值 转 换 到 相对 记录 号 (或 相对 文件 地 址 ) 的 
程序 。(6) 

异 义 (Homonym): 可 能 有 多 种 含义 的 属性 。(5) 

水 平分 割 (Horizontal partitioning) : 将 表 的 行 分 布 到 几 个 单独 的 文件 。(6) 

超 文本 标记 语言 (Hypertext Markup Language，HTML): 用 于 在 Web 浏 览 器 上 显示 文档 
的 脚本 语言 ， 类 似 于 SGML (一 种 更 全 面 的 信息 管理 标准 )。(10) 

标识 符 (Identifier) : 可 以 惟一 标识 一 个 实体 类 型 实例 的 属性 或 属性 集 。(3) 

标识 属 主 (ldentifying owner): 弱 实 体 类 型 所 依赖 的 实体 类 型 。(3) 

标识 联系 (ldentifying relationship) : 弱 实 体 类 型 与 其 属 主 之 间 的 联系 。(3) 





不 一 致 读 问题 (Inconsistent read problem) : 当 一 个 用 户 读 到 已 被 其 他 用 户 部 分 更 新 的 
数据 时 ， 所 出 现 的 不 可 重复 的 读 取 现象 。(12) 

增 量 提交 (Incremental commitment) : 系统 开发 项 目 中 的 一 种 策略 ， 它 在 每 个 阶段 后 进 
行 检查 ， 在 每 次 检查 后 重新 调整 项 目的 后 续 部 分 。(2) 

增 量 抽取 (Incremental extract); 一 种 数据 获取 方法 ， 只 获取 自 上 次 数据 提取 后 源 数 据 发 
生变 化 的 部 分 。(11) 

独立 数据 集 市 (independent data mart) : 一 种 数据 集 市 ， 它 的 数据 是 从 运作 环境 中 提取 
的 ， 并 且 不 具有 数据 仓库 的 优点 。(11) 

索引 (Index): 一 个 表 或 其 他 数据 结构 ， 用 于 决定 文件 中 满足 某 些 条 件 的 行 的 位 置 。(6) 

索引 文件 组 织 (Indexed file organization) : 记录 在 文件 里 顺序 或 是 非 顺序 存放 ， 使 用 索 
引 来 定位 每 条 记录 。(6 ) 

信息 (Information): 以 增加 使 用 数据 者 知识 的 某 种 方式 进行 处 理 的 数据 。(1) 

信息 工程 (Iinformation engineering) : 一 种 自 顶 向 下 的 面向 数据 的 形式 化 方法 ， 用 于 信 
息 系统 的 创建 和 维护 。(2) 

信息 库 (Information repository): 一 种 用 来 存储 元 数据 的 组 件 。 它 描述 组 织 的 数据 与 数 
据 处 理 的 资源 , 管理 总 体 的 信息 处 理 环境 ， 并 把 该 组 织 的 业务 信息 及 其 应 用 软件 包 组 合 在 一 起 。 
(12) 

信息 库 词 典 系统 (Information Repository Dictionary System，IRDS): 用 于 管理 和 控制 
对 信息 库 访 问 的 一 种 计算 机 软件 工具 。(12) 

信息 系统 体系 结构 (Information Systems Architecture ，ISA): 表示 组 织 中 信息 系统 的 未 
来 结构 的 概念 性 蓝图 或 规划 。(2) 

信息 系统 (Informational system): 建立 在 历史 数据 和 预测 数据 基础 上 的 系统 ， 用 于 支持 
决策 制定 、 复 杂 查 询 和 数据 挖掘 应 用 。( 11) 

企业 内 部 网 (Intranet): 使 用 因特网 协议 建立 对 公司 内 数据 和 信息 的 访问 。(]) 

. 非法 入 做 检测 系统 (Intrusion detection system，IDS): 一 种 试图 识别 非法 进入 计算 机 系 
统 或 误 用 计算 机 系统 企图 的 系统 。IDS 可 以 监控 网 络 上 传输 的 包 ， 监 控 系 统 文件 、 日 志文 件 ， 
或 设置 尝试 诱捕 黑客 。(10) 

Java; 一 种 通用 的 、 面 向 对 象 的 编程 语言 ， 特 别 适用 于 Web。 称 为 Java applets 的 小 Java 程 
序 从 Web 服 务 器 下 载 到 客户 端 ， 并 且 在 与 Java 兼 容 的 浏览 器 上 运行 。(10) 

Java servlet: 一 种 不 是 在 操作 系统 而 是 在 其 他 应 用 程序 中 执行 的 小 程序 ， 并 且 它 是 存储 
在 服务 器 上 而 不 是 和 应 用 程序 一 起 存储 在 客户 端 。(10) . 

JavaScript， 一 种 基于 Java 但 比较 容易 学 习 的 脚本 语言 ， 用 于 获得 Web 页 面 的 交互 性 。(10) 

联结 (Join): 将 两 张 具 有 公共 域 的 表 合并 成 为 一 张 表 或 视图 的 关系 操作 。(8) 

联结 索引 (Join index): 创建 在 来 自 于 多 个 表 的 列 上 的 一 个 索引 ， 这 些 列 有 相同 的 值 域 。 
(6) 

联结 操作 (Joining) : 把 不 同 来 源 的 数据 合并 为 一 张 表 或 视图 的 过 程 。(11) 

日 志 记录 工具 (Journalizing facility) :事务 和 数据 库 变化 的 一 种 审计 追踪 工具 。 (12) 

遗留 数据 (Legacy data): 新 系统 安装 前 使 用 的 系统 所 包含 的 数据 。 遗留 数据 常常 驻 留 在 
二 机 系统 中 ， 该 系统 已 经 被 客户 机 /服务 器 系统 或 Web 系 统 所 替代 。(1) 

列表 (List) : 同类 型 元 素 的 有 序 集 合 。(15) 

本 地 自治 (Local autonomy): 分 布 式 数据 库 的 一 种 设计 目标 ， 也 就 是 说 ， 站 点 在 连接 其 
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他 结 点 失败 时 可 以 独立 管理 和 操作 其 数据 库 。(13) 

本 地 事务 (Local transaction): 分 布 式 数据 库 中 的 一 种 事务 ， 它 仅 要 求 引 用 存放 在 发 生 
该 事务 的 站 点 的 数据 。(13) 

位 置 透 明 性 (Location transparency): 分 布 式 数 据 库 的 一 个 设计 目标 ， 也 就 是 说 ， 使 用 
数据 的 用 户 〈 或 用 户 程 序 ) 无 须知 道 该 数据 所 在 的 位 置 。(13) 

加 锁 (Locking): 对 用 户 为 了 更 新 而 检索 出 来 的 任何 数据 必须 加 以 锁定 ， 以 便 拒绝 其 他 用 
户 使 用 ， 一 直到 更 新 完成 或 者 中 止 为 止 。(12) 

加 锁 层 次 /粒度 (Locking level (granularity)) : 每 次 锁定 所 包括 的 数据 库 资源 的 范围 。(12) 

逻辑 数据 集 市 (Logicat data mart) : 由 数据 仓库 的 关系 视图 所 创建 的 数据 集 市 。(10) 

购物 篮 分 析 (Market basket analysis) : 对 某 个 顾客 的 购买 行为 进行 研究 。(11) 

大 规模 并 行 处 理 / 无 共享 体系 结构 (Massively parallel processing (MPP)/shared nothing 
architecture): 每 个 CPU 拥有 自己 专用 的 存储 器 的 大 规模 并 行 处 理 系统 。(9) 

物化 视图 (Materialized view): 基于 SQL 查询 ， 以 与 动态 视图 相同 的 方式 创建 的 数据 找 
贝 或 数据 副本 。 然 而 ， 物 化 视图 以 表 的 形式 存在 ， 因 此 必须 注意 使 它 与 相关 的 基 表 保持 同步 。 
(7) 

最 大 基数 (Maximum cardinality) : 与 某 实体 的 每 一 个 实例 相关 联 的 另 一 个 实体 实例 的 最 
大 个 数 。(3) 

元 数据 (Metadata): 描述 其 他 数据 的 性 质 或 特征 的 数据 。(1) 

方法 (Method) : 操作 的 实现 。(14) 

中 间 件 (Middleware): 允许 某 个 应 用 程序 与 其 他 软件 实现 互 操作 而 不 要 求 用 户 了 解 和 编 
码 实现 这 种 互 操作 性 的 低层 操作 的 软件 。(9) 

最 小 基数 (Minimum cardinality): 与 某 实 体 的 每 -- 个 实例 相关 联 的 另 一 个 实体 实例 的 最 
小 个 数 。(3) 

多 维 OLAP (Multidimensional OLAP，MOLAP)， 一 种 OLAP 工 具 ， 把 数据 装 入 一 个 中 间 
结构 ， 通 常 是 三 维 或 更 高 维 的 数组 。(11) 

多 重 分 类 (Multiple classification) : 一 个 对 象 是 多 于 一 个 类 的 实例 。(14) 

多 重 性 (Multiplicity): 说 明 在 一 个 给 定 的 联系 中 有 多 少 个 对 象 参与 的 规格 说 明 。(14) 

多 值 届 性 (Multivalued attribute) : 在 给 定 实体 实例 中 可 以 带 有 多 个 值 的 属性 。(3) 

多 值 依赖 (Multivalued dependency): 一 种 存在 于 至 少 含有 3 个 属性 (如 A、B 和 C) 的 关 
系 里 的 函数 依赖 。 对 于 每 个 A 的 值 ，B 和 C 都 有 定义 明确 的 值 集 ; 而 B 和 C 的 值 彼此 无 关 。(B) 

自然 联结 (Natural join) : 与 等 值 连结 相同 ， 只 是 在 结果 表 中 不 包括 重复 列 。(8) 

范式 (Normal form) : 通过 对 关系 应 用 某 些 关于 函数 依赖 (或 是 属性 间 的 关联 ) 的 简单 准 
则 后 所 得 到 的 关系 的 状态 。(5) . 

规范 化 (Normalization): 将 含有 异常 的 关系 分 解 为 更 小 的 ， 结构 良好 的 关系 的 过 程 。 
(5) 

空 值 (Null) : 当 没有 其 他 值 适用 ， 或 是 适用 值 未 知 时 ， 可 以 赋 给 属性 的 值 。(S) 

对 象 (Object) : 对 象 是 一 个 实体 ， 在 应 用 域内 扮演 着 定义 明确 的 角色 ， 有 状态 、 行 为 和 
标识 。(14) 

对 象 类 (Object class) : 共享 公共 结构 和 公共 行为 的 对 象 集 。(14) 

对 象 图 (Object diagram): 与 给 定 类 图 兼容 的 实例 图 。(14) 

对 象 -关系 数据 库 管 理 系统 (Object-relational database management system): 以 集成 
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的 方式 支持 关系 和 面向 对 象 特性 的 数据 库 3| 擎 。(C) 

联机 分 析 处 理 (On-Line Analytical Processing，OLAP): 使 用 一 组 图 形 工 具 向 用 户 提供 
数据 的 多 维 视图 ， 并 允许 用 户 利用 简单 的 窗口 技术 对 数据 进行 分 析 。(11) 

开放 数据 库 互 连 标准 (Open database connectivity (ODBC) standard) : 一 个 为 应 用 程 
序 提供 一 种 公用 语言 以 访问 和 处 理 SQL 数 据 库 而 与 所 访问 的 特定 关系 数据 库 管 理 系统 无 关 的 应 
用 程序 接口 。(9) 

操作 (Operation) : 由 类 的 所 有 实例 提供 的 函数 或 服务 。(14) 

运作 数据 存储 (Operational Data Store，ODS): 一 种 集成 的 、 面 向 主题 的 、 可 更 新 的 、 
有 具有 当前 值 的 详细 数据 库 ， 它 可 以 向 作 决策 支持 处 理 的 终端 用 户 提供 服务 。(10) 

运作 系统 (Operational system) : 基于 当前 数据 实时 执行 某 种 业务 的 系统 ， 也 称 为 记录 
系统 。(11) | 

外 连结 (Outer join): 车 某 一 行 在 其 他 表 的 相同 列 中 没有 匹配 的 值 ， 该 行 仍然 包含 在 结果 
表 中 。(8) 

交 夫 规则 (Overlap rule): 指定 一 个 实体 实例 可 以 同时 是 两 个 (或 多 个 ) 子 类 型 的 成 员 。 
(4) 

重 载 (Overriding) : 用 子 类 中 更 特殊 的 方法 实现 来 替换 从 超 类 中 继承 的 方法 的 过 程 。(14) 

页 (Page): 操作 系统 在 -二 级 存储 (磁盘 ) 一 次 输入 或 输出 操作 中 所 读 写 的 数据 量 。 对 于 
具有 磁 类 型 的 VO 来 说 ， 共 等 价 的 术语 是 记录 块 。(6) 

部 分 函数 依赖 (Partial functional dependency): 非 键 属性 函数 依赖 于 部 分 (不 是 全 部 ) 
主键 的 一 种 函数 依赖 。( 5 ) 

部 分 特 化 规则 (Partial specialization rule): 指定 一 个 超 类 型 的 实例 可 以 不 属于 任何 子 类 
型 。(4) 

周期 数据 (Periodic data) : 一 旦 添加 到 存储 器 就 不 会 被 物理 更 改 或 删除 的 数据 。(11) 

持久 化 存储 模块 (Persistent Stored Module，SQL/PSM): 在 SQL-99 中 定义 的 SQL 扩 展 ， 
包括 通过 用 户 会 话 创建 和 撤销 代码 模块 的 功能 ， 这 些 代 码 模块 存储 在 数据 库 模式 中 。(8) 

物理 文件 (Physical file): 用 来 存储 物理 记录 的 二 级 存储 (如 磁带 和 硬盘 ) 的 已 命名 的 一 
部 分 。(6) 

物理 记录 (Physical record): 一 组 在 内 存 里 邻接 存储 的 字段 ， 可 以 由 DBMS 作 为 一 个 单 
元 进行 读 写 。(6) 

物理 模式 (Physical schema): 关于 概念 模式 的 数据 如 何 存储 在 计算 机 二 级 存储 器 中 的 规 
格 说 明 。(2) ， 

插件 (Plug-ins): 通过 增加 某 些 特性 (如 加 密 、 动 画 或 无 线 访问 ) 来 扩展 浏览 器 功能 的 
软件 或 硬件 模块 。(10) 

指针 (Pointer): 一 个 数据 字段 ， 它 用 来 定位 一 个 相关 的 数据 字段 或 记录 。(6) 

多 态 (Polymorphism): 同样 的 操作 可 以 以 不 同方 式 使 用 到 两 个 或 多 个 类 上 的 现象 。(14) 

主键 (Primary key): 惟一 标识 关系 中 每 一 行 的 的 属性 (或 属性 集 )。(5) 

过 程 (Procedure) : 一 个 过 程 性 的 SQL 语句 集合 ， 在 数据 库 模式 中 被 分 配 了 一 个 惟一 的 名 
字 ， 并 存储 在 数据 库 中 。(8) 

项 目 (Project): 为 了 达到 一 个 目标 而 进行 的 具有 开始 和 结束 的 相关 活动 的 计划 。(2) 

原型 法 (Prototyping): 系统 开发 的 迭代 过 程 ， 在 分 析 员 和 用 户 的 紧密 配合 下 ， 通 过 不 断 
的 修正 将 需求 最 终 转换 成 一 个 工作 系统 。(2) 
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代理 服务 器 (Proxy server); 管理 来 往 于 局 域 网 的 因特网 通信 量 的 防火 墙 组 件 。 它 还 能 
处 理 访问 控制 和 文档 高 速 缓存 。(10) 

查询 操作 (Query operation) : 能 访问 对 象 的 状态 、 但 不 能 改变 其 状态 的 操作 。(14) 

按 例 查询 (Query-by-Example): 一 种 使 用 图 形 化 方法 构建 查询 的 直接 操纵 数据 库 语言 。 
(9) 

调和 数据 (Reconciled data): 详细 的 当前 数据 ， 并 且 是 所 有 决策 支持 应 用 系统 的 一 个 权 
威 的 来 源 。(11) 

恢复 管理 器 (Recovery manager): DBMS 的 一 个 模块 ， 在 出 现 故 障 时 它 将 数据 库 还 原 成 
正确 的 条 件 ， 并 继续 处 理 用 户 的 请 求 。(12) 

递归 外 键 (Recursive foreign key): 引用 自己 所 在 关系 主键 值 的 外 键 。(5) 

廉价 完 余 磁盘 阵列 (Redundant Array of Inexpensive Disk，RAID): 一 组 物理 磁盘 驱动 
器 ， 对 于 数据 库 用 户 〈 以 及 程序 ) 而 言 ， 它 们 就 好 像 是 一 个 大 的 逻辑 存储 单元 。(6) 

参照 完整 性 (Referential integrity) : 完整 性 约束 的 一 种 ， 它 指定 关系 中 属性 的 值 (或 存 
在 ) 依赖 于 同一 个 关系 或 其 他 关系 中 主键 的 值 (或 存在 )。(7) 

参照 完整 性 约束 (Referential integrity constraint): 一 个 关系 中 的 外 键 值 ， 或 者 与 另 一 个 
关系 的 主键 值 相 匹 配 ， 或 者 必须 为 空 。( 5 ) 

刷新 模式 (Refresh mode): 一 种 定期 重 写 目 标 数据 的 填充 数据 仓库 的 方法 。(11) 

关系 (Relation): 一 个 命名 的 两 维 数据 表 。(5) 

关系 数据 库 管理 系统 (Relational DBMS，RDBMS): 一 个 数据 库 管理 系统 ， 它 把 数据 作 
为 表 的 集合 来 管理 ; 其 中 所 有 的 数据 联系 用 相关 表 中 的 公共 数值 来 表达 。(7) 

关系 OLAP (Relational OLAP，ROLAP): 一 种 OLAP 工 具 ， 把 数据 库 看 作 是 传统 的 关系 
数据 库 〈 可 以 是 星 型 模式 或 其 他 规范 化 / 非 规范 化 的 表 集 合 )。(11) 

联系 实例 (Relationship instance): 两 个 (或 多 个 ) 实体 实例 之 间 的 关联 ， 其 中 每 个 联 
系 实例 恰好 包括 参与 联系 的 各 实体 类 型 中 的 一 个 实例 。(3) 

联系 类 型 (Relationship type): 两 个 (或 多 个 ) 实体 类 型 之 间 有 意义 的 关联 。(3) 

复制 透明 性 (Replication transparency) : 指 分 布 式 数 据 库 的 一 种 设计 目标 ， 也 就 是 说 ， 
虽然 一 个 给 定 的 数据 项 可 以 在 网 络 的 多 个 结 点 上 复制 ， 但 程序 员 或 者 用 户 仍然 可 以 把 该 数据 项 
当成 是 在 单一 结 点 上 的 单一 数据 项 那样 进行 处 理 。 也 可 以 称 之 为 段落 透明 性 。(13) 

信息 库 (Repository): 所 有 数据 定义 、 数 据 联系 、 屏 幕 和 报表 格式 及 其 他 系统 组 成 部 分 
的 中 央 知 识 库 。(1,2) 

复原 /再 运行 (Restore/rerun) : 利用 数据 库 的 备用 拷贝 ， 重 新 处 理 当天 事务 (直至 故障 点 ) 
的 一 种 技术 。(12) 

逆向 代理 (Reverse proxy) : 一 种 负载 平衡 方法 ， 截 取 来 自 客户 端的 请 求 并 且 在 Web 服 务 
器 中 高 速 缓存 返回 客户 端的 响应 。(10) 

路 由 器 (Router): 通信 网 络 的 中 间 设 备 ， 用 来 传输 信息 包 ， 并 以 最 有 效 的 路 径 将 信息 包 
发 送 到 正确 的 目的 地 。(10) 

标量 聚合 (Scalar aggregate) : 一 个 包含 聚合 国 数 的 SQL 查询 返回 单个 的 值 。(7) 

模式 (Schema): 数据 库 的 一 部 分 ， 包 含 用 户 创建 的 对 象 (如 基 表 、 视 图 和 约束 ) 的 描 
述 的 结构 。(7) 

范围 操作 (Scope operation): 应 用 于 类 而 不 是 应 用 于 对 象 实例 的 一 种 操作 。(14) 

第 二 范式 (Second normal form) : 一 个 关系 满足 第 一 范式 ， 且 每 -个 非 键 属性 都 完全 函 
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数 依赖 于 主键 。(5) 

辅 键 (Secondary key): 字段 或 字段 的 组 合 ， 多 个 记录 可 以 在 这 些 字 段 上 有 相同 的 值 。 
也 称 为 非 惟一 键 。(6) 

选择 (Selection): 根据 预先 定义 的 准则 划分 数据 的 过 程 。(11) - 

半 联 结 (Semijoin): 分 布 式 数据 库 所 采用 的 一 种 联结 操作 ， 其 中 仅 有 联结 属性 才 从 一 个 
站 点 传输 到 另 一 个 站 点 ， 而 不 是 从 每 个 符合 条 件 的 行 选 出 的 全 部 属性 。(13) 

顺序 文件 组 织 (Sequential file organization) : 文件 中 的 记录 按照 主键 值 顺序 存储 。(6) 

服务 器 端 扩展 (Server-side extension): 一 种 软件 程序 ， 直 接 与 Web 服 务 器 交互 ， 以 处 
理 各 种 请 求 。(10) 

集 (Set): 没有 重复 元 素 的 无 序 集合 。(15) 

共享 锁 /S 锁 / 读 锁 (Shared lock (S lock or read lock)): 允许 别 的 事务 读 但 不 能 更 新 记录 
或 其 他 资源 的 一 种 技术 。(12) 

简单 属性 (Simple attribute) : 不 能 分 解 为 更 小 组 件 的 属性 。(3) 

雪花 模式 (Snowflake schema) : 星 型 模式 的 扩展 版 本 ， 在 这 种 模式 里 ， 维 表 规 范 化 为 若 
干 相关 表 。(11) 

软 硬 件 负载 平衡 (Software and hardware load balancing): 一 种 负载 平衡 方法 ， 对 一 个 
IP 地 址 的 请 求 在 TCP/IP 路 由 层 被 分 配 到 驻 留 在 站 点 的 多 台 服 务 器 上 。(10) 

特 化 (Specialization) : 定义 超 类 型 的 一 个 或 多 个 子 类 型 并 形成 超 类 型 / 子 类 型 联系 的 过 程 。 
(4) 

标准 通用 标记 语言 (Standard Generalized Markup Language，SGML): 1986 年 由 国际 
标准 化 组 织 采 纳 的 脚本 文档 的 信息 管理 标准 ， 其 中 定义 了 跨 平台 和 跨 应 用 的 脚本 文档 格式 化 、 
索引 和 链接 信息 。(4) 

星 型 模式 (Star schema) : 一 种 简单 的 数据 库 设计 ， 在 这 种 模式 中 ， 维 数据 与 事实 或 事 
件数 据 相 分 离 。 多 维 模型 是 是 型 模式 的 另 一 个 名 字 。(11) 

状态 (State): 包含 对 象 的 性 质 (属性 和 联系 ) 和 这 些 性 质 具 有 的 值 。(14) 

静态 抽取 (Static extract) : 一 种 获取 所 需要 的 源 数据 在 某 个 时 间 点 的 快照 的 方法 。(11) 

存储 过 程 (Stored procedure): 一 个 代码 模块 ， 通 常 使 用 诸如 Oracle 的 PL/SQL 或 者 
Sybase 的 Transact-SQL 这 样 的 专用 语言 编写 ， 能 够 实现 应 用 逻辑 或 某 项 业务 规则 ， 并 存储 在 服 
务 器 上 ， 在 调用 时 运行 。(9) 

条 (Stripe): RAID 中 所 有 磁盘 上 的 页 集 ， 它 们 与 磁盘 开始 位 置 相 对 距离 相等 。(6) 

强 实体 类 型 (Strong entity type): 不 依赖 于 其 他 实体 类 型 而 独立 存在 的 实体 类 型 。(3) 

结构 断言 (Structural assertion) : 表示 组 织 静态 结构 某 些 方面 的 语句 。(4) 

结构 化 文字 (Structured literal) : 由 固定 数目 的 已 命名 元 素 组 成 ， 每 一 个 元 素 可 以 是 文字 
或 对 象 类 型 。(15) 

子 类 型 (Subtype): 对 组 织 有 意义 的 实体 类 型 中 实体 的 分 组 ， 它 们 共享 与 其 他 分 组 不 同 
的 公共 的 属性 和 关系 。(4) 

子 类 型 鉴别 符 (Subtype discriminator): 超 类 型 的 一 个 属性 ， 其 值 决 定 了 目标 子 类 型 或 
子 类 型 。(4) 

超 类 型 (Supertype) ;与 一 个 或 多 个 子 类 型 有 联系 的 通用 实体 类 型 。(4) 

超 类 型 / 子 类 型 层次 (Supertype/subtype hierachy) : 超 类 型 和 子 类 型 的 层次 结构 安排 。 
其 中 ， 每 一 个 子 类 型 只 有 一 个 超 类 型 。(4) 
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对 称 多 处 理 (Symmetric Multiprocessing，SMP): 一 种 多 个 处 理 器 共享 -- 块 内 存 的 并 行 
处 理 体系 结构 。(9) 

同步 分 布 式 数 据 库 (Synchronous distributed database): 分 布 式 数据 库 技 术 的 一 种 形式 。 
其 中 ， 网 络 上 的 所 有 数据 一 直 保持 最 新 的 状态 ， 使 得 任何 站 点 上 的 用 户 随 时 都 能 够 访问 网 络 上 
任何 地 方 的 数据 ， 并 能 得 出 相同 的 结果 。 (13) 

同义词 (Synonyms): 两 个 (或 多 个 ) 属性 名 字 不 同 ， 但 是 意义 却 相同 ， 因 为 它们 描述 
的 是 一 个 实体 的 相同 特征 。(5) 

系统 目录 (System catalog): 一 种 系统 所 创建 的 数据 库 ， 用 于 描述 全 部 数据 库 对 象 ， 包 
括 数据 词典 信息 ， 也 包括 用 户 访问 信息 。(12) 

系统 开发 生命 周期 (Systems Development Life Cycle，SDLC): 用 于 开发 、 维 护 和 替换 
信息 系统 的 传统 方法 学 。(2) 

表 空 间 (Tablespace) : 命名 的 磁盘 存储 空间 ， 用 来 存储 数据 库 表 的 物理 文件 。(6) 

术语 (Term): 在 业务 中 有 特定 含义 的 词 或 短语 。(3) 

三 元 联系 (Ternary relationship) : 同时 存在 于 :个 实体 类 型 的 实例 之 间 的 联系 
(3) 

瘦 客 户 机 (Thin client) : 一 台 用 来 处 理 用 户 界 面 和 若干 应 用 的 PC， 通 常设 有 或 只 有 很 小 
的 本 地 数据 存储 器 。(9) 

第 三 范式 (Third normal form) : 满足 第 二 范式 ， 是 不 含 传递 依赖 关系 。(5) 

三 层 体系 结构 (Three-tier architecture): 一 种 包含 二 层 的 客户 /服务 器 配置 ， 即 包含 一 个 
客户 机 层 和 两 个 服务 器 层 。 尽 管 两 个 服务 器 层 的 本 质 有 所 不 同 ， 但 它们 共同 的 配置 是 都 拥有 一 
个 应 用 程序 服务 器 。(9) 

时 间 稚 (Time stamp): 与 数据 值 相 联 系 的 时 间 值 。(3) 

盖 时 间 惟 (Timestamping): 分 布 式 数据 库 中 的 一 种 并 发 性 控制 机 制 ， 它 为 每 个 事务 分 配 
一 个 全 局 惟一 的 时 间 蕉 。 盖 时 间 惟 是 在 分 布 式 数据 库 中 使 用 锁 的 另 一 种 方式 。(13) 

自 顶 向 下 规划 (Top-down.planning):; 一 种 试图 获取 对 整个 组 织 信息 系统 需求 的 广泛 理解 
的 通用 的 信息 系统 规划 方法 学 。(2) 

完全 特 化 规则 1 specialization rule): 指定 超 类 型 的 每 一 个 实体 实例 必须 是 联系 中 -一 
些 子 类 型 的 一 个 成 员 。 

事务 (Transaotion) 必须 完整 地 加 以 处 理 或 者 不 限于 在 单一 计算 机 系统 内 完成 的 离散 工 
作 ( 作 业 ) 单 元 。 输 入 一 张 顾客 订单 就 是 事务 的 一 个 例子 。(12) 

事务 边界 (Transaction boundary): 即 事务 的 逻辑 起 点 与 终点 。(12) 

事务 日 志 (Transaction log): 在 数据 库 中 处 理 的 每 一 项 事务 的 基本 数据 之 记录 。 (12) 

事务 管理 器 (Transaction manager): 分 布 式 数据 库 中 的 一 种 软件 模块 ， 用 来 维护 所 有 事 
务 以 及 合适 的 并 发 性 控制 模式 的 日 志 。(13) 

临时 数据 (Transient data) : 对 现存 数据 的 修改 直接 在 前 面 数据 的 基础 上 进行 ， 因 此 前 面 
的 数据 内 容 遭 到 了 破坏 。(11) : 

传递 依赖 (Transitive dependency): 两 个 (或 多 个 ) 非 键 属性 间 的 函数 依赖 。 (5) 

触发 器 (Trigger) : 一 个 命名 的 SQL 语 句 集合 ， 当 数据 修改 (INSERT、 UPDATE 和 
DELETE) 发 生 时 考虑 它 〈 被 触发 )。 如 果 触 发 器 中 的 条 件 满 足 ， 则 执行 预先 设 定 的 动作 。(9) 

两 阶段 提交 (Two-phase commit) ;用 于 协调 分 布 式 数据 库 中 的 更 新 操作 的 一 一 种 算法 。(13) 

两 阶段 加 锁 协 议 (Two-phase locking protocol) : 为 了 得 到 某 个 事务 所 必需 的 锁 的 一 种 算 
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法 过 程 ， 该 事务 要 求 在 释放 任何 锁 之 前 ， 先 得 到 所 有 其 必需 之 锁 ; 即 在 得 到 锁 时 上 归 人 一 个 增长 
阶段 ， 而 在 它们 释放 时 形成 一 个 收缩 阶段 。(12) 

一 元 关联 (Unary relationship): 同一 实体 类 型 的 不 同 实例 之 间 的 联系 。(3) 

更 新 模式 (Update mode): 一 种 只 向 数据 仓库 写 入 源 数 据 变化 的 方法 。(11) 

更 新 操作 (Update operation): 改变 对 象 状态 的 操作 。(14) 

用 户 视图 (User view): 用 户 实现 一 些 任务 所 需要 的 数据 库 一 些 部 分 的 逻辑 描述 。(1) 

用 户 自 定义 数据 类 型 (User-defined Datatype，UDT): SQL-99 允 许 用 户 建立 标准 类 型 的 
子 类 或 创建 一 个 具有 对 象 行为 的 类 型 来 定义 自己 的 数据 类 型 。UDT 也 可 以 定义 函数 和 方法 。 
(8) 

用 户 自 定义 过 程 (User-defined procedure): 一 种 允许 系统 设计 者 除了 授权 规则 之 外 定 
义 自己 的 安全 性 过 程 的 用 户 出 口 (或 界面 )。(12) 

VBScript: 一 种 基于 Microsoft Visual Basic 的 脚本 语言 ， 与 JavaScript 类 似 。(10) 

向 量 聚合 (Vector aggregate) : 一 个 包含 聚合 国 数 的 SQL 查询 返回 的 多 个 值 。(7) 

版 本 设置 (Versioning): 每 个 事务 限制 于 一 个 该 事务 开始 时 刻 的 数据 库 视 图 ， 而 每 当 事 
务 修改 了 某 个 记录 时 ，DBMS 便 会 创建 一 个 新 的 记录 版 本 而 不 是 覆盖 老 的 记录 。 这 样 ， 也 就 无 
须 任 何 形式 的 加 锁 了 。(12) 

垂直 分 割 (Vertical partitioning) : 将 表 的 列 分 布 到 多 个 独立 的 物理 记录 。(6) 

Visual Basic 应 用 程序 (Visual Basic for Application，VBA): 伴随 Access 2000 的 编程 语 
言 。(9) 

弱 实 体 类 型 《Weak entity type) : 依赖 于 其 他 实体 类 型 而 存在 的 实体 类 型 。(3) 

良 构 关系 (Well-structured relation) : 含有 最 小 元 余 的 关系 ， 用 户 可 以 插入 、 修改 和 删除 
表 中 行 ， 而且 不 会 出 现 错误 和 不 一 致 的 情况 。(5) 

万 维 网 (World Wide Web，WWW): 驻 留 在 特定 服务 器 ( 称 为 Web 服 务 器 或 HTTP 服 务 
器 ) 上 并 且 内 部 相互 链接 的 超 文本 文档 的 全 体 集 合 。 配 置 Web 服 务 器 ， 使 每 个 人 能 够 很 容易 地 
访问 它们 所 拥有 的 信息 ， 同 时 允许 文件 被 访问 、 传 输 和 下 载 。 也 称 为 W3 或 者 Web。(10) 

万 维 网 联盟 (World Wide Web Consortium，W3C): 一 个 国际 性 的 公司 联盟 ， 致 力 于 开 
发 开放 式 标准 ， 这 些 标 准 有 利于 开发 Web 规 范 ， 使 Web 文 档 能 够 跨 平台 地 一 致 显示 。(10) 

XHTML: 一 种 混合 脚本 语言 ， 它 扩展 HTML 代 码 使 之 与 XML 兼容 。(10) 


